首页 > 快讯 > 全新的情感解放!Fish Audio推出S2版本:支持多说话人、微调词级情绪、全面开放源代码

全新的情感解放!Fish Audio推出S2版本:支持多说话人、微调词级情绪、全面开放源代码

发布时间:2026-03-11 13:34:42 | 责任编辑:张毅 | 浏览量:53 次

Fish Audio 正式发布新一代文本转语音(TTS)模型 S2,标志着开源TTS技术在表现力和可控性上迎来重大突破。
这款名为 Fish Audio S2的模型主打超强情感可控性,用户可通过自然语言指令实现精细化的韵律与情绪调节,例如在文本中插入 [laugh](笑)、[whispers](耳语)、[super happy](超级开心)等标签,甚至支持自由描述如 [professional broadcast tone](专业播音腔)或 [pitch up](升高音调),在词级或短语级实现精准控制,生成极富表现力、自然生动的语音。
核心亮点包括:
Fish Audio 表示,S2基于约1000万小时、覆盖近50种语言的音频数据训练,结合强化学习对齐与双自回归架构,在多项基准测试中展现出领先的自然度与表现力,被誉为当前开源与闭源TTS中最具情感智能的系统之一。“真正的语言自由,从现在开始。” Fish Audio 以这句话宣告:从机械朗读走向真正富有情感与个性的AI语音时代已来。
GitHub:
https://github.com/fishaudio/fish-speech/
HuggingFace:https://huggingface.co/fishaudio/s2-pro/

全新的情感解放!Fish Audio推出S2版本:支持多说话人、微调词级情绪、全面开放源代码

这是一篇关于真正的情感自由!Fish Audio发布S2:多说话人、词级情绪控制、完全开源的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐