首页 > 快讯 > 全新的情感解放！Fish Audio推出S2版本：支持多说话人、微调词级情绪、全面开放源代码

全新的情感解放！Fish Audio推出S2版本：支持多说话人、微调词级情绪、全面开放源代码

发布时间：2026-03-11 13:34:42 | 责任编辑：张毅 | 浏览量：97 次

Fish Audio 正式发布新一代文本转语音（TTS）模型 S2，标志着开源TTS技术在表现力和可控性上迎来重大突破。
这款名为 Fish Audio S2的模型主打超强情感可控性，用户可通过自然语言指令实现精细化的韵律与情绪调节，例如在文本中插入 [laugh](笑)、[whispers](耳语)、[super happy](超级开心)等标签，甚至支持自由描述如 [professional broadcast tone](专业播音腔)或 [pitch up](升高音调)，在词级或短语级实现精准控制，生成极富表现力、自然生动的语音。
核心亮点包括:
Fish Audio 表示，S2基于约1000万小时、覆盖近50种语言的音频数据训练，结合强化学习对齐与双自回归架构，在多项基准测试中展现出领先的自然度与表现力，被誉为当前开源与闭源TTS中最具情感智能的系统之一。“真正的语言自由，从现在开始。” Fish Audio 以这句话宣告:从机械朗读走向真正富有情感与个性的AI语音时代已来。
GitHub:
https://github.com/fishaudio/fish-speech/
HuggingFace:https://huggingface.co/fishaudio/s2-pro/

这是一篇关于真正的情感自由！Fish Audio发布S2：多说话人、词级情绪控制、完全开源的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：发现情感的绝对自由！Fish Audio unveiled S2：支持多个说话者、精准词汇情感调控、全面开放源代码

下一篇： Meta 收购AI代理平台Moltbook，其创始人将融入超级智能实验室团队

全新的情感解放！Fish Audio推出S2版本：支持多说话人、微调词级情绪、全面开放源代码

最新Ai信息

最新Ai工具

热门AI推荐