首页 > 快讯 > 革命性低延迟体验！Cartesia 发布 Sonic-3 语音AI引擎：实现高度拟人对话，响应时间快至不足100毫秒

革命性低延迟体验！Cartesia 发布 Sonic-3 语音AI引擎：实现高度拟人对话，响应时间快至不足100毫秒

发布时间：2025-10-29 10:12:16 | 责任编辑：吴昊 | 浏览量：166 次

Cartesia 公司重磅发布其最新语音 AI 引擎 Sonic-3，宣称其为当前市场上速度最快、最自然的实时语音对话模型。Sonic-3的核心目标是提供极致自然与迅速的语音交互体验，使 AI 能够以几乎零延迟的方式进行对话，并模拟人类的情感、语气乃至笑声和情绪变化，从而大幅提升交流的真实性和表现力。
Sonic-3的突破性性能得益于其采用了全新的 “状态空间模型”（SSM）架构，而非传统的 Transformer 模型。Cartesia 介绍，SSM 架构能更有效地模拟人类思维，记住对话主题和情绪，无需每次都从头分析上下文，从而在语音自然度和低延迟性能方面达到前所未有的水平。该模型延迟低于 100毫秒，使其在实时语音交互行业中处于领先地位。
在功能和覆盖范围上，Sonic-3展现出强大的全球化潜力。它支持 42种语言，覆盖全球 95% 的人口，包括9种印度语言，能为不同市场的需求提供母语级的语音模型。Sonic-3还具备智能上下文理解能力，能够自动识别并正确朗读如 NASA、FBI 等缩写和首字母缩写词，显著增强了对话的流畅性。此外，该引擎支持语音克隆功能，用户可在短短 10秒内生成个性化语音，企业版还提供专业的语音调优与品牌音色定制服务。
Sonic-3的应用前景广阔，可广泛应用于客户支持、虚拟伴侣、医疗保健和物流服务业等领域，通过情绪化的语音显著提升客户服务体验。
为支持 Sonic-3的进一步研发与推广，Cartesia 同时宣布已完成 1亿美元的融资，投资方包括 Kleiner Perkins、Index Ventures、Lightspeed 和 NVIDIA 等知名企业。Cartesia 相信，随着 Sonic-3的推出，人机交互领域将迎来重大突破，为用户带来更加丰富与自然的交流体验。用户可访问 Cartesia 官方网站在线体验 Sonic-3。
地址：https://cartesia.ai/sonic

这是一篇关于突破性低延迟!Cartesia 推出 Sonic-3语音 AI 引擎:极致拟人化，对话延迟低于100毫秒的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇： Adobe Firefly Image 5全新进化：原生生成400万像素图像，AI音轨与定制模型开启创作者“全栈式”AI创作新纪元

下一篇： Direct Payments and Business Purchases Within ChatGPT Enabled by OpenAI and PayPal Collaboration

革命性低延迟体验！Cartesia 发布 Sonic-3 语音AI引擎：实现高度拟人对话，响应时间快至不足100毫秒

最新Ai信息

最新Ai工具

热门AI推荐