首页 > 快讯 > Meta AI发布“全能”语音识别软件，覆盖超过1600种语言，全面消除全球语言障碍！

Meta AI发布“全能”语音识别软件，覆盖超过1600种语言，全面消除全球语言障碍！

发布时间：2025-11-11 10:42:02 | 责任编辑：张毅 | 浏览量：180 次

【小编报道】 Meta的基础人工智能研究（FAIR）团队近日宣布推出Omnilingual ASR，这是一款创新的自动语音识别系统，能够转录超过1600种口语语言。此举旨在弥合现有AI工具在语言覆盖上的巨大差距，正式迈向“通用转录系统”的目标。
长期以来，大多数语音识别系统仅专注于少数拥有大量转录音频资源的语言，导致全球7000多种语言中，有数千种几乎得不到AI支持。Omnilingual ASR的发布将改变这一现状。Meta指出，在其支持的1600种语言中，有500种语言此前从未被任何人工智能系统覆盖。
Omnilingual ASR的性能令人瞩目:
在测试的1600种语言中，系统对78%的语言实现了低于10个字符的错误率。
对于拥有至少10小时训练音频的“资源丰富”语言，这一准确率标准达到了95%的覆盖。
即使是音频时长不足10小时的“低资源”语言，也有36%的语言错误率低于10个字符的阈值，为这些群体带来了实用的语音识别功能。
Omnilingual ASR的一个关键创新是其“自带语言”选项，该功能借鉴大型语言模型的情境学习技术。用户只需提供少量的音频和文本配对样本，系统即可直接从这些样本中学习新语言，无需重新训练或大量的计算资源。
Meta表示，理论上，这一方法有望将Omnilingual ASR的覆盖范围扩展到超过5400种语言，远远超越了当前的行业标准。
为了支持进一步的研究和应用，Meta采取了全面的开源策略:
模型开源: Omnilingual ASR以Apache2.0许可证发布，允许研究人员和开发者自由使用、修改和构建模型，包括用于商业用途。模型基于PyTorch的fairseq2框架构建，提供了从适用于低功耗设备的3亿参数版本到追求“顶级准确度”的70亿参数版本。
数据集发布: Meta同步发布了全语言自动语音识别语料库（Omnilingual ASR Corpus），这是一个包含350种代表性不足语言的大型转录语音数据集。该数据以**知识共享署名许可协议（CC-BY）**发布，旨在帮助全球开发者调整语音识别模型，以满足特定的本地化需求。
Omnilingual ASR的推出标志着打破全球语言壁垒的重要一步，为全球语言平等和AI技术的普惠化开辟了新道路。

这是一篇关于Meta AI推出“全语种”语音识别系统，一口气支持1600+语言，打破全球语言壁垒!的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇： Altman展望：AI时代的汹涌而来，人类原创与认可的作品将会显著升值

下一篇：为新兴AI销售平台1mind，6sense的创始人成功募集资金3000万美元

Meta AI发布“全能”语音识别软件，覆盖超过1600种语言，全面消除全球语言障碍！

最新Ai信息

最新Ai工具

热门AI推荐