首页 > 快讯 > Gemini2.5Flash Native Audio 通过谷歌升级增强语音助手效能

Gemini2.5Flash Native Audio 通过谷歌升级增强语音助手效能

发布时间:2025-12-17 11:07:22 | 责任编辑:张毅 | 浏览量:32 次

谷歌最近发布了 Gemini2.5Flash Native Audio 的更新,显著增强了其语音助手的功能。这一版本旨在更好地处理复杂的工作流程,提高执行用户指令的准确性,同时使对话更加自然流畅。根据谷歌的反馈,新版本在开发者指令的遵循率上从84% 提升至90%,这表明语音助手在理解和执行用户请求方面有了显著进步。
在多步骤对话的质量上,更新也带来了明显改善。用户在与语音助手互动时,将体验到更流畅的沟通。这种提升使得助手能够更好地适应复杂的询问和任务,使用户感受到更高效的服务。
谷歌还透露,更新后的音频模型在 ComplexFuncBench 基准测试中,函数调用的准确率达到了71.5%,相比之下,OpenAI 的 gpt-realtime 则为66.5%。不过需要指出的是,谷歌在测试中可能并未使用 OpenAI 最近发布的最新版本。
此次更新已经在 Google AI Studio、Vertex AI、Gemini Live 和 Search Live 中上线,Google Cloud 的客户也开始使用这项新技术。开发者们可以通过 Gemini API 对模型进行测试,进一步探索其潜力。
这次的更新不仅仅是功能的提升,也反映出谷歌在人工智能领域不断进步的决心和努力,为用户提供更好的体验。
划重点:
🌟 更新后的语音助手在遵循用户指令方面的准确率从84% 提升至90%。
📈 新版本在 ComplexFuncBench 基准测试中,函数调用准确率达到71.5%。
💻 开发者可通过 Gemini API 对新模型进行测试,体验其改进的功能。

Gemini2.5Flash Native Audio 通过谷歌升级增强语音助手效能

这是一篇关于谷歌升级 Gemini2.5Flash Native Audio 提升语音助手表现的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐