首页 > 快讯 > Google推出Gemini TTS 2.5：情绪化语音新体验，支持24种语言和多角色即时切换

Google推出Gemini TTS 2.5：情绪化语音新体验，支持24种语言和多角色即时切换

发布时间：2025-12-11 16:54:07 | 责任编辑：张毅 | 浏览量：149 次

Google发布Gemini2.5Flash与Pro文本转语音预览模型，全面替代今年5月旧版系统。新模型主打「情绪级」表达、上下文自适应节奏及24语种多角色对话，开发者现可在Google AI Studio与Playground免费测试，预计2025年Q1进入生产环境。
情绪级表达:从「欢快乐观」到「阴郁严肃」一键切换
- 风格响应:对「欢快乐观」「阴郁严肃」等提示词即时调整音色与语速
- 用例:有声书、游戏NPC、本地化课件，避免传统TTS机械感
- 演示:Synergy Intro应用可实时体验多风格切换，输出即专业配音
节奏自适应:上下文感知快慢，叙事更生动
- 机制:复杂解释自动放缓，兴奋段落加速，支持「慢条斯理悬疑→急促惊险」动态变化
- 示例:神秘小说朗读可随剧情逐步加速，转折「咔嗒」一声实现张力释放
- 适用:产品教程、营销视频，告别单调朗读
多角色+24语种:跨语种一致，角色不串线
- 功能:多说话者身份锁定，对话交接自然过渡
- 语言:覆盖英、法、德、日、印地语等24种，保留原音调与风格
- 演示:Voices from History应用实现英-多语种混用历史对话，角色个性稳定
行业反馈:订阅率+20%，成本-20%
- 音频平台:集成后多说话者模式受追捧，订阅率+20%，首月流失率-20%，运营成本-20%
- 内容工作室:英/印地语漫画配音角色一致性获赞，沉浸感显著提升
- 平台计划:2025年Q1推出低延迟Flash版与高质量Pro版并行，满足实时与精品双需求
下一步:低延迟Flash+精品Pro双线并行
Google表示，2025年Q1将并行优化低延迟Flash版（<300ms首包）与高质量Pro版(48kHz采样)，并开放边缘节点部署，目标渗透播客、互动游戏、虚拟主播等实时场景。小编将持续跟踪其边缘节点部署及付费模式更新。
官网地址：https://x.com/GoogleAIStudio/status/1998876411734692107

这是一篇关于Gemini TTS 2.5正式上线：Google推情绪级语音，24语种+多角色一键切换的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇： Meta即将推出的全新AI模型名为“牛油果”，明年面世，其蒸馏学习技术备受行业瞩目

下一篇：黑马AI技术服务商崛起：蚂蚁数科今年推出超百种智能体合作方案

Google推出Gemini TTS 2.5：情绪化语音新体验，支持24种语言和多角色即时切换

最新Ai信息

最新Ai工具

热门AI推荐