首页 > 快讯 > 全球顶尖语音转写模型MAI-Transcribe-1由微软发布

全球顶尖语音转写模型MAI-Transcribe-1由微软发布

发布时间:2026-04-03 10:40:37 | 责任编辑:张毅 | 浏览量:35 次

近日,微软宣布推出全新的语音转文字模型 MAI-Transcribe-1,该模型在 25 种语言上的平均词错误率(WER)仅为 3.9%,被誉为目前全球最精准的转写模型。这是微软自研的 MAI 系列模型中的第三款,之前还发布了语音合成模型 MAI-Voice-1 和图像生成模型 MAI-Image-2。
根据微软的介绍,MAI-Transcribe-1 在 FLEURS 行业标准基准测试中表现出色,尤其是在 25 种语言中,11 种 “核心语言” 如英语、法语、德语等的转写精度排名第一。这款模型不仅在多种语言的转写场景中表现优异,还在与 OpenAI 的 Whisper-large-v3 和 Google 的 Gemini 3.1 Flash 模型的对比中显示出明显优势。
MAI-Transcribe-1 适用于多语种的各种语音转写场景,包括会议记录、媒体内容转写等。尽管当前版本尚不支持实时转写、说话人分离等高级功能,微软计划在后续更新中增强这些能力。在性能方面,新模型在批量转写任务上速度领先,批处理转写速度达到了现有 Microsoft Azure Fast 产品的 2.5 倍。
此外,MAI-Transcribe-1 已通过 Microsoft Foundry 平台向企业和开发者开放,定价为每小时 0.36 美元,微软表示这是当前云服务提供商中 “性价比最高” 的语音转写模型之一。微软还宣布将 MAI-Image-2 和 MAI-Voice-1 引入 Foundry 平台,进一步增强其语音识别、语音合成和图像生成等多模态 AI 领域的自研能力,力求为开发者提供更具性能和成本优势的解决方案。
划重点:
📊 MAI-Transcribe-1 在 25 种语言上平均词错误率仅为 3.9%,为全球最精准转写模型。
🌍 模型在多种语言的核心转写场景中表现突出,并超越其他竞争对手。
💰 每小时收费 0.36 美元,使其成为云服务市场中性价比最高的语音转写模型之一。

全球顶尖语音转写模型MAI-Transcribe-1由微软发布

这是一篇关于微软推出全球最高精度的语音转写模型 MAI-Transcribe-1的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐