首页 > 快讯 > 亚马逊推新一代AI语音模型Nova Sonic,捕捉语气、语调变化和节奏

亚马逊推新一代AI语音模型Nova Sonic,捕捉语气、语调变化和节奏

发布时间:2025-04-09 11:20:34 | 责任编辑:字母汇 | 浏览量:37 次

亚马逊近日推出了一款新型 AI 语音模型 ——Nova Sonic,旨在提升其语音助手 Alexa + 的性能。Nova Sonic 被设计用于本地处理语音并生成自然流畅的回复,标志着亚马逊在语音识别技术领域的又一次突破。
Nova Sonic 采取了一种全新的整合方式,将语音理解和生成的能力统一到一个模型中。这一创新不仅简化了语音应用的开发过程,还能根据语音输入的声学背景(如语调和风格)来调整生成的语音响应,从而实现更加自然的对话。Nova Sonic 甚至能够理解人类对话中的细微之处,包括说话者的自然停顿和犹豫,能够在适当的时候等待说话,并优雅地处理插话情况。
例如,在一个虚拟旅行助手的对话中,当客户从兴奋转为担忧时,AI 的语气会随之变得更加安抚,帮助客户获取相关的价格信息。此外,Nova Sonic 还能为用户的语音生成文本转录,使开发者能够利用这些文本调用特定的工具和 API,从而构建更为强大的语音 AI 代理。
根据亚马逊的介绍,Nova Sonic 在速度、语音识别和通话质量等关键指标上,与 OpenAI 和谷歌的领先语音模型相匹敌。该模型已通过亚马逊的 Bedrock 开发平台向开发者开放,亚马逊声称其成本比 OpenAI 的 GPT-4o 低80%。虽然 OpenAI 也提供了一种更为实惠的选择 ——GPT-4o-Mini,但 Nova Sonic 的推出无疑为市场带来了更多选择。
Nova Sonic 的最大亮点之一是其在复杂环境下的语音识别能力。这意味着,在嘈杂或干扰的背景中,该模型依然能够有效地识别用户的指令,并进行准确回应。此外,Nova Sonic 还具备高效处理用户请求的能力,能够灵活地将请求路由到不同的 API,实现更快速的响应。
亚马逊的 SVP 兼首席科学家 Rohit Prasad 表示,Nova Sonic 的推出不仅是技术的进步,也是公司在人工智能领域持续创新的体现。他提到,随着语音助手在日常生活中的应用越来越广泛,提升语音识别的准确性和响应速度显得尤为重要。
作为智能家居的核心组成部分,Alexa + 的表现直接影响用户体验。通过引入 Nova Sonic,亚马逊希望能够进一步提升用户与设备的互动体验,提供更加自然、流畅的对话能力。
官方博客:https://www.aboutamazon.com/news/innovation-at-amazon/nova-sonic-voice-speech-foundation-model
划重点:
🌟 Nova Sonic 是亚马逊新推出的 AI 语音模型,旨在提升 Alexa + 的性能。
💰 该模型的成本比 OpenAI 的 GPT-4o 低80%,为开发者提供更多选择。
🔊 Nova Sonic 具备在复杂环境下的语音识别能力,能够快速准确地处理用户请求。

亚马逊推新一代AI语音模型Nova Sonic,捕捉语气、语调变化和节奏

亚马逊近日推出了新一代AI语音模型Nova Sonic,该模型能够高效处理语音输入并生成自然流畅的语音输出。Nova Sonic的主要亮点包括:

  • 整合语音理解和生成能力:Nova Sonic将语音识别、理解和生成的能力统一到一个模型中,简化了语音应用的开发过程。这使得模型能够根据语音输入的声学背景(如语调和风格)来调整生成的语音响应,从而实现更加自然的对话。
  • 捕捉对话中的细微之处:Nova Sonic能够理解人类对话中的细微之处,包括说话者的自然停顿和犹豫。它能够在适当的时候等待说话,并优雅地处理插话情况。
  • 高精度语音识别:Nova Sonic在多语言LibriSpeech基准测试中,英语、法语、意大利语、德语和西班牙语的平均单词错误率仅为4.2%,显著优于竞品。
  • 低延迟与高性价比:Nova Sonic的平均感知延迟仅为1.09秒,比OpenAI的GPT-4o模型更快。此外,其价格比OpenAI的GPT-4o低约80%,是市场上最具成本效益的AI语音模型之一。
  • 支持多种语言和风格:目前Nova Sonic支持美国英语和英国英语等多种说话风格和不同口音,并计划扩展对更多语言和口音的支持。

Nova Sonic通过亚马逊的Bedrock开发者平台提供服务,支持企业级AI应用的构建。该模型已为亚马逊升级版语音助手Alexa+提供动力支持。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具