首页 > 快讯 > Mistral 隆重发布全新语音识别AI模型，强调卓越超低延迟性能！

Mistral 隆重发布全新语音识别AI模型，强调卓越超低延迟性能！

发布时间：2026-02-11 17:44:41 | 责任编辑：吴昊 | 浏览量：135 次

法国 AI 领军企业 Mistral AI 正式发布了两款全新的语音转文字（Speech-to-Text）模型，旨在重新定义转录速度、隐私保护与性价比的行业标准。
此次推出的模型包括 Voxtral Mini Transcribe V2 和 Voxtral Realtime，均隶属于 Voxtral Transcribe2体系。这两款模型可提供顶级的转录质量、说话人识别（Diarization）以及极低的延迟表现，适用于虚拟助手、呼叫中心自动化及合规记录等多种商业场景。
核心产品亮点:
Voxtral Realtime（实时处理）: 专为直播音频设计，采用创新的流式架构。其延迟最低可配置为 200毫秒。在480毫秒的延迟下，错误率仅为1%-2%，几乎等同于离线转录精度。该模型仅有40亿参数，支持在手机或笔记本电脑等本地设备上运行，极大保障了隐私安全。目前已在 Hugging Face 平台以 Apache2.0协议开源，API 价格为 0.006美元/分钟。
Voxtral Mini Transcribe2（批量处理）: 专门处理预录音文件。它支持长达3小时的单次请求，并具备精准的说话人标注和时间戳功能。其在 FLEURS 词错率基准测试中表现优异，而 API 价格仅为 0.003美元/分钟，被 Mistral AI 称为目前市场上性价比最高的转录方案。
两款模型均原生支持包括中文、英语、法语、日语在内的13种语言。用户目前已可在 Mistral AI 的 Audio Playground 或 Le Chat 助手上进行体验。
🚀 极致性能:实时模型延迟低至200ms，离线模型具备极高的词错率（WER）优势。
🔒 本地化部署:4B 参数量的轻量化设计支持在本地设备运行，无需上传云端，确保隐私安全。
💰 高性价比:批量转录 API 低至每分钟0.003美元，力求在企业市场建立价格优势。
🌍 多语言支持:原生支持全球13种主流语言，涵盖绝大部分商业应用场景。

这是一篇关于主打极致低延迟！Mistral 推出全新语音转文字 AI 模型的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：千问App势头强劲：日活跃用户达7352万，连续6日占据App Store免费榜首位

下一篇：网易年度收入超千亿，丁磊表示：AI已从“辅助手段”提升至网易的“核心优势”

Mistral 隆重发布全新语音识别AI模型，强调卓越超低延迟性能！

最新Ai信息

最新Ai工具

热门AI推荐