首页 > 快讯 > Inworld 发布新一代 TTS-1.5:即时语音合成,低时延,兼容多种语言

Inworld 发布新一代 TTS-1.5:即时语音合成,低时延,兼容多种语言

发布时间:2026-01-22 13:00:29 | 责任编辑:吴昊 | 浏览量:64 次

近日,人工智能公司 Inworld 正式发布了其最新的文本转语音模型 TTS-1.5。该模型以其自然、富有表现力的实时语音而备受关注,能够在低延迟的情况下提供多语言支持。
根据官方介绍,TTS-1.5的使用成本约为每分钟0.005美元,声称比市场上的同类产品便宜25倍,这一价格无疑将吸引大量用户的关注。
TTS-1.5在技术上实现了低于250毫秒的实时延迟,这意味着用户可以在对话中几乎感觉不到任何延迟。语音合成技术的提升,不仅在速度上有了显著改善,模型在表达力和稳定性方面也进行了优化。这为各种应用场景,尤其是游戏和虚拟现实领域的对话系统提供了新的可能性。
除了极具竞争力的价格,用户对低延迟的需求也在不断上升。许多用户认为,延迟是文本转语音技术面临的一大挑战。如今,Inworld 的这一创新成果为实现更真实的对话体验铺平了道路。用户在社交平台上对这一技术表现出了浓厚的兴趣,并期待能在自己的项目中应用这一新模型。
划重点:
📢 TTS-1.5模型推出,具备自然的语音合成和多语言支持。
💰 该模型每分钟费用约为0.005美元,比市场同类产品便宜25倍。
⚡ 实现低于250毫秒的实时延迟,为用户提供更真实的对话体验。

Inworld 发布新一代 TTS-1.5:即时语音合成,低时延,兼容多种语言

这是一篇关于Inworld 推出全新 TTS-1.5:实时语音,延迟低,并支持多语言的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐