首页 > 快讯 > OpenAI 语音API显著升级:数字转录精确度提升,处理效率急速增长40%
OpenAI 语音API显著升级:数字转录精确度提升,处理效率急速增长40%
发布时间:2026-02-25 13:14:13 | 责任编辑:吴昊 | 浏览量:41 次
OpenAI 近日面向全球开发者推出了两项关键 API 更新,旨在大幅提升 AI 智能体在语音交互与复杂任务流中的性能表现。
在模型层面,全新的实时模型 gpt-realtime-1.5 及其配套音频模型正式登场,其核心目标是提高语音命令的可靠性。根据 OpenAI 内部测试数据,新模型在处理数字和字母的转录准确率上提升了约 10%,逻辑音频任务准确率提高了 5%,而指令执行的准确率也相应提升了 7%,有效解决了 AI 在听取关键短语或执行复杂语音指令时的偏差问题。
在架构层面,Responses API 现已支持 WebSocket 协议,这标志着 AI 通信模式的重大变革。与以往每次请求都必须重新传输完整上下文的模式不同,WebSocket 允许开发者建立持久连接,系统仅在产生新数据时进行增量发送。
OpenAI 指出,这一改进对于需要频繁调用大量工具的复杂 AI 代理尤为关键,能够将其运行速度直接提升 20% 到40%。这两项更新不仅让 AI 的“听力”更敏锐,更让其“行动”效率迈向了全新的台阶。
©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
