微软发布自主开发AI模型MAI-Voice-1与MAI-1-preview,旨在与OpenAI抗衡
发布时间:2025-08-29 11:02:30 | 责任编辑:吴昊 | 浏览量:16 次
近日,微软的人工智能部门正式发布了其首个自家研发的 AI 模型,命名为 MAI-Voice-1和 MAI-1-preview。这标志着微软在人工智能领域的进一步发展,尤其是在与 OpenAI 的竞争中。
MAI-Voice-1是一个语音模型,能够在不到一秒的时间内生成一分种的音频,只需一块 GPU 即可实现。微软表示,MAI-Voice-1已经应用于多个功能之中,例如 “Copilot Daily”,这个功能可以让 AI 主持人为用户朗读当天的头条新闻,并生成类似播客的讨论,以帮助解释各种主题。
用户可以在 Copilot Labs 中体验 MAI-Voice-1,输入想让 AI 模型说的话,并可选择不同的声音和演讲风格。此外,微软还推出了 MAI-1-preview 模型,该模型在大约15,000块 Nvidia H100GPU 上进行训练,主要针对需要能够遵循指令并提供日常查询帮助的用户。
微软 AI 首席官 Mustafa Suleyman 曾在去年接受采访时表示,公司的内部 AI 模型并不专注于企业级的应用案例。他强调,微软致力于创造对消费者非常有用的产品,并在广告和消费者行为数据方面拥有丰富的预测能力。未来,MAI-1-preview 将应用于 Copilot AI 助手的一些文本使用场景,目前该助手还依赖于 OpenAI 的大型语言模型。
微软在其博客中表示:“我们对未来的发展抱有雄心,不仅会追求进一步的进步,还相信通过协调一系列不同用户意图和使用场景的专业模型,将释放巨大的价值。”
官方博客:https://microsoft.ai/news/two-new-in-house-models/
划重点:
🌟 微软推出 MAI-Voice-1和 MAI-1-preview 两款自家开发的 AI 模型,提升与 OpenAI 的竞争力。
🗣️ MAI-Voice-1可以快速生成音频,已应用于 Copilot Daily 等多个功能。
🚀 MAI-1-preview 将用于 Copilot AI 助手的文本处理,标志着微软在消费级 AI 领域的新进展。
。
两款模型核心信息:
① MAI-Voice-1:高效语音生成模型
-
性能:仅需单块GPU,即可在1秒内生成1分钟的高质量音频
。
-
应用:
-
已集成至Copilot Daily,AI主持人可播报当日新闻;
-
支持生成播客风格对话,帮助用户理解复杂话题;
-
用户可在Copilot Labs中体验,支持自定义语音风格与音色
。
-
② MAI-1-preview:通用文本模型
-
规模:基于MoE(专家混合)架构,训练动用了约1.5万块英伟达H100 GPU
。
-
特点:微软首个端到端自主训练的基础模型,擅长遵循用户指令,提供日常问题的实用回应
。
-
计划:未来几周将应用于Copilot助手的特定文本场景,与OpenAI模型并行使用,而非替代
。
微软AI战略与OpenAI竞争关系:
-
减少依赖:长期以来,微软产品(如Bing、Windows 11)主要依赖OpenAI模型,此次推出自研模型旨在降低对外部技术的依赖
。
-
竞争态势:尽管微软已向OpenAI投资超过130亿美元,但两者关系逐渐转向竞争,微软去年已将OpenAI列入年度报告的竞争对手名单
。
-
未来规划:微软AI负责人穆斯塔法·苏莱曼(Mustafa Suleyman)表示,公司将持续推进技术突破,致力于打造面向消费者、深度优化的AI产品
。
用户参与与体验:
-
公开测试:MAI-1-preview已上线AI基准测试平台LMArena,用户可参与评估模型性能
。
-
开发者接入:微软已开放早期API权限申请,供开发者与合作伙伴提前体验与集成
。
综上所述,微软此次发布的两款自研AI模型不仅展现了其技术实力与战略野心,也标志着其与OpenAI的竞争进入新阶段。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。