升级后的ChatGPT语音功能让OpenAI对话更流畅自然
发布时间:2025-06-09 11:03:36 | 责任编辑:吴昊 | 浏览量:5 次
《升级后的ChatGPT语音功能让OpenAI对话更流畅自然》相关软件官网

OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。
在今年年初,OpenAI 已经对这一语音模式进行了小幅更新,改善了打断频率和口音处理。而此次的重大升级,更是使语音回复的语调变得更加细腻、节奏更加自然,尤其是在停顿和强调的处理上,显得更加生动。此外,更新后的系统能够更加精准地表达各种情绪,包括同情和讽刺,使得机器与人类的交流更具人情味。
更令人兴奋的是,本次更新还增加了翻译功能。ChatGPT 用户只需简单指令,便可让它在对话中进行实时翻译,直到收到停止指令。这一功能的推出,无疑会减少对专门语音翻译应用的需求,进一步提升用户体验。目前,更新后的高级语音模式仅向付费用户开放。
尽管这一系列的改进显著提升了语音交互的质量,但 OpenAI 也明确指出,当前更新仍存在一些已知的局限性。例如,在某些情况下,音频质量可能会略有下降,音调和语调可能出现意外变化,尤其是在某些语音选项中较为明显。此外,偶尔也会出现与真实对话不符的情况,例如出现广告、胡言乱语或背景音乐的意外声音。OpenAI 表示,他们将继续努力提升音频的一致性,逐步解决这些问题。
这次升级不仅让 AI 的语音交互体验更加自然,也为人类与人工智能之间的沟通打下了更为坚实的基础。
2025年6月8日,OpenAI针对ChatGPT的付费用户升级了高级语音模式,此次更新使语音交互体验更加自然和流畅。以下是升级后的具体体验:
语音语调与自然度
- 语调变化:加入了更细腻的语调变化,语音不再单调,能够根据语义和情感需求调整音调。
- 真实语速:语音的语速更加贴近真实人类的说话节奏,包括自然的停顿和强调,使对话听起来更自然。
情感表达
情感表达更加精准,能够涵盖同情、讽刺等多种情绪,使对话更具“人情味”。例如,在表达同情时,语音会带有适当的温柔和缓和的语气;而在表达讽刺时,则会通过语调和语气的微妙变化来体现。
多语言翻译功能
新增了直观且高效的多语言翻译功能。用户只需要求语音进行语言翻译,它便会在整个对话过程中持续提供翻译服务,直至用户要求停止或切换语言。比如,在国外旅行时,用户可以用母语与当地人交流,ChatGPT会实时翻译双方的话语,确保沟通顺畅。
其他优化
- 减少语音中断:在此次更新的基础上,进一步减少了语音中断现象,使对话更加连贯。
- 优化语音口音:对语音的口音进行了优化,使其更接近母语者的发音水平。
不过,此次更新也存在一些问题。在测试过程中,OpenAI发现可能会偶尔导致音频质量出现轻微下降,包括音调和音高的意外变化。此外,语音模式中仍然存在极少数的“幻觉”现象,可能会产生类似广告、胡言乱语或背景音乐的意外声音。开发团队正在积极调查这些问题,并致力于尽快找到解决方案。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。