首页 > 快讯 > 全新FunAudio-ASR语音识别技术亮相阿里，显著提升降噪能力

全新FunAudio-ASR语音识别技术亮相阿里，显著提升降噪能力

发布时间：2025-09-16 18:23:54 | 责任编辑：张毅 | 浏览量：298 次

近日，阿里巴巴通义实验室正式发布了其最新的端到端语音识别大模型 ——FunAudio-ASR。这个模型的最大亮点在于它的创新 “Context 模块”，让高噪声环境下的语音识别准确率得到了显著提升，幻觉率从78.5% 大幅降低至10.7%，降幅近乎70%。这一技术突破为语音识别行业树立了新的标杆，尤其适用于嘈杂的场合，如会议、公共场所等。
FunAudio-ASR 模型在训练过程中使用了数千万小时的音频数据，并将大语言模型的语义理解能力融入其中，使其在远场、嘈杂和多说话人等复杂条件下的表现，已经超越了诸如 Seed-ASR、KimiAudio-8B 等众多主流语音识别系统。通过这一技术的应用，用户在进行语音识别时，能够享受到更清晰、更精准的识别效果。
除了完整版本外，阿里还推出了轻量化版本 FunAudio-ASR-nano。该版本在保持高识别准确率的同时，降低了推理成本，适合那些对资源要求较高的部署环境。无论是大企业还是小型团队，都能找到适合自己的解决方案。
目前，FunAudio-ASR 已经在钉钉的 “AI 听记” 功能、视频会议以及 DingTalk A1硬件中得到了实际应用。此外，其 API 也已在阿里云百炼平台上正式上线，方便开发者进行集成和使用。对于企业用户而言，这意味着他们可以利用这一先进技术提升会议效率，增强沟通效果。
FunAudio-ASR 不仅为语音识别技术带来了新突破，更为用户的实际应用提供了强大支持，推动了 AI 技术的进一步普及和应用。
官方介绍：https://mp.weixin.qq.com/s/7l5EPTU7cpz7GSN4RP91rg

这是一篇关于阿里巴巴推出革命性语音识别模型FunAudio-ASR，降噪效果惊人的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：腾讯HunyuanImage 2.1荣登榜首！开放源码的2K文本转图像巨匠，能否瞬间打造高清艺术品？

下一篇：全新语音识别技术FunAudio-ASR由阿里巴巴发布，其降噪性能令人赞叹

全新FunAudio-ASR语音识别技术亮相阿里，显著提升降噪能力

最新Ai信息

最新Ai工具

热门AI推荐