首页 > 快讯 > MiniMax Speech 2.6新版登场，Fluent LoRA迅速模仿任意声音，实时交互语音合成技术现已实现，延迟控制在250毫秒以内！

MiniMax Speech 2.6新版登场，Fluent LoRA迅速模仿任意声音，实时交互语音合成技术现已实现，延迟控制在250毫秒以内！

发布时间：2025-10-30 10:17:32 | 责任编辑：张毅 | 浏览量：269 次

当AI语音不仅能“像人说话”，还能“像你说话”，且快到几乎无感，语音交互的边界正在被彻底重构。 10 月 30 日凌晨，MiniMax稀宇科技正式发布其新一代语音合成模型——MiniMax Speech 2.6，以端到端延迟低于 250 毫秒的实时性能与革命性的Fluent LoRA音色复刻技术，将语音生成推向高自然度、低延迟、强个性化的全新阶段。
在语音交互场景中，延迟是体验的生命线。Speech 2. 6 通过底层架构优化，实现从文本输入到音频输出全程低于 250 毫秒，接近人类自然对话的响应节奏。这意味着在智能客服、实时字幕、虚拟主播等高要求场景中，AI语音不再“慢半拍”，真正实现流畅对答与沉浸式交互。
本次最大突破在于Fluent LoRA（Low-Rank Adaptation）技术的深度集成。用户仅需提供 30 秒以上的参考音频，模型即可精准捕捉说话人的音色、语调、节奏甚至情感风格，并生成与目标文本高度匹配的自然语音。无论是复刻自己的声音讲述睡前故事，还是为品牌定制专属虚拟代言人，音色克隆从未如此简单、高效且逼真。
更关键的是，Fluent LoRA在保证音色一致性的前提下，显著提升语音流畅度，避免传统TTS常见的“机械断句”或“情感错位”问题，让合成语音真正具备“表达力”。
MiniMax Speech 2. 6 同时面向个人创作者与企业客户开放：
作为MiniMax多模态大模型生态的关键一环，Speech 2. 6 不仅强化了其在AIGC领域的技术纵深，更标志着语音合成正从“功能可用”迈向“情感可信、个性可定制”的新纪元。
在AI竞争日益聚焦“体验细节”的今天，MiniMax用 250 毫秒的延迟与一句“像你一样说话”的能力，证明了：真正的智能，不仅在于算得快，更在于说得像人、说得动人。

这是一篇关于延迟低于250毫秒！MiniMax Speech 2.6发布，Fluent LoRA一键复刻任意音色，语音合成迈入实时交互时代的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：新型保护方案gpt-oss-safeguard由OpenAI发布，助力AI行业灵活规避风险

下一篇： OpenAI Sora限时体验：美加日韩用户免邀请码直接登录

MiniMax Speech 2.6新版登场，Fluent LoRA迅速模仿任意声音，实时交互语音合成技术现已实现，延迟控制在250毫秒以内！

最新Ai信息

最新Ai工具

热门AI推荐