首页 > 快讯 > 助力非洲重掌AI数据主权,Google发布语音数据集WAXAL

助力非洲重掌AI数据主权,Google发布语音数据集WAXAL

发布时间:2026-02-12 17:39:22 | 责任编辑:吴昊 | 浏览量:2 次

Google 近日在非洲正式推出名为 WAXAL 的全新语音数据集。该项目涵盖了阿乔利语、豪萨语、卢干达语、约鲁巴语等 21 种非洲语言,旨在解决长期以来非洲语言在 AI 系统中识别准确率低、错误频出的“生存性问题”。
该项目的核心突破在于:
数据主权归还:不同于以往巨头掌控数据的模式,WAXAL 数据集的所有权完全归属于参与建设的非洲本地机构,而非 Google 本身。
规模庞大且专业:数据集包含超过 1.1 万小时 的语音和近 200 万条 录音。其中包括约 1250 小时的转写语音,以及可用于文本转语音(TTS)的高保真音频。
赋能本地创新:项目以宽松许可方式开源,允许商业使用。目前,加纳大学等机构已开始利用这些数据推进孕产妇健康等本地化 AI 应用研究。
尽管面临语种复杂、缺乏声调符号等技术挑战,WAXAL 的发布标志着非洲正从单纯的数据采集方转变为技术基础设施的拥有者。Google 计划未来将语种扩展至 27 种,进一步推动非洲 AI 话语权的提升。

助力非洲重掌AI数据主权,Google发布语音数据集WAXAL

这是一篇关于Google 推出非洲语音数据集 WAXAL,助力非洲夺回 AI 数据主权的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐