Meta 收购 WaveForms 加速其音频人工智能发展战略
发布时间:2025-08-12 10:38:42 | 责任编辑:张毅 | 浏览量:7 次
据《The Information》报道,Meta 已收购 AI 语音初创公司 WaveForms,交易金额未披露。这是 Meta 旗下新 AI 部门 Superintelligence Labs 的最新收购,也是该公司一个月内的第二笔 AI 音频领域重要并购,上月 Meta 刚完成对 PlayAI 的收购。
WaveForms 成立仅八个月,曾在由 Andreessen Horowitz 领投的融资中获得4000万美元,融资前估值达1.6亿美元。
据悉,WaveForms 两位联合创始人——前 Meta 与 OpenAI 研究员 Alexis Conneau 和前谷歌广告策略师 Coralie Lemaitre——已加盟 Meta。Conneau 在 OpenAI 期间曾参与创建 GPT-4o Advanced Voice Mode 神经网络。TechCrunch 已联系 WaveForms,询问公司首席技术官 Kartikay Khandelwal 是否也会加入 Meta,以及公司约14名员工(LinkedIn 数据)的去向。
WaveForms 官网已下线,但其 LinkedIn 页面显示,公司致力于解决“语音图灵测试”(Speech Turing Test)——旨在判断听众能否分辨人类与 AI 生成语音。此外,WaveForms 还在研发“情感通用智能”(Emotional General Intelligence),聚焦于个体自我意识与情绪管理能力的理解与建模。
Meta 近日已完成对 AI 语音初创公司 WaveForms AI 的收购,具体金额未披露。此次收购是 Meta 为强化其新成立的 超级智能实验室(Superintelligence Labs) 而进行的最新动作,也是近一个月内 Meta 在 AI 音频领域的第二笔收购(此前收购了 PlayAI)。
WaveForms AI 成立于 2024 年 12 月,专注于开发能够实时理解和响应语音中情感细微差别的 音频大语言模型(Audio-based Large Language Models)。其核心目标是实现 “语音图灵测试”,即让 AI 生成的语音在情感表达和自然度上与人类无法区分,并致力于 “情感通用智能”(Emotional General Intelligence, EGI) 的研发,使 AI 能够感知并回应用户的情绪状态。
WaveForms 的技术亮点在于其 端到端音频语言模型,能够通过单一模型一次性完成语音转文本、文本生成与语音合成三大任务,无需多个独立模型协同,显著提升了处理效率和交互流畅性。
WaveForms 的联合创始人 Alexis Conneau(前 Meta 和 OpenAI 研究员,曾主导 GPT-4o 高级语音模式的研发)和 Coralie Lemaitre(前谷歌广告策略师)将加入 Meta 超级智能实验室,并向该实验室语音技术负责人 Johan Schalkwyk(前谷歌杰出研究员)汇报。
此次收购被视为 Meta 在 AI 语音赛道上的重要加码,旨在弥补其 Llama 4 模型在类人语音对话能力上的不足,未来相关技术将应用于 Meta AI 聊天机器人、Instagram Reels 内容生成及元宇宙虚拟角色语音系统,显著提升人机交互的自然度与沉浸感。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。