双方合作创新:Mistral AI与英伟达共同开发“自主”AI基础架构及卓越预测模型
发布时间:2025-06-13 09:29:08 | 责任编辑:张毅 | 浏览量:7 次
法国人工智能初创公司Mistral AI周三宣布全面进军人工智能基础设施领域,将其公司定位为欧洲对美国云计算巨头的有力回应。与此同时,该公司还推出了可与OpenAI最先进系统相媲美的新型推理模型。
这家总部位于巴黎的公司发布了Mistral Compute,这是一个与英伟达(Nvidia)合作构建的综合AI基础设施平台,旨在为欧洲企业和政府提供替代方案,摆脱对亚马逊网络服务(AWS)、微软Azure和谷歌云(Google Cloud)等美国云提供商的依赖。此举标志着Mistral AI的重大战略转变,从单纯开发AI模型转向掌控整个技术栈。
Mistral AI首席执行官兼联合创始人Arthur Mensch表示:“进军人工智能基础设施领域标志着Mistral AI迈出了转型的一步,因为它使我们能够触及人工智能价值链中一个关键的垂直领域。这一转变意味着我们有责任确保我们的解决方案不仅能够推动创新和人工智能的普及,还能维护欧洲的技术自主权,并为其可持续发展领导力做出贡献。”
除了基础设施的宣布,Mistral还发布了其Magistral系列推理模型——这些人工智能系统能够进行逐步逻辑思考,类似于OpenAI的o1模型和中国的DeepSeek R1。然而,Mistral首席科学家Guillaume Lample表示,该公司的方法在关键方面与竞争对手有所不同。
Lample在一次独家采访中透露:“我们一切都是从零开始,主要是因为我们想学习我们现有的专业知识,比如工作中的灵活性。实际上,我们在更强大的在线强化学习流程上做到了非常高效的水平。”与竞争对手经常隐藏推理过程不同,Mistral的模型会向用户展示完整的思维链,并且至关重要的是,它使用用户的母语,而不是默认的英语。Lample解释说:“我们用用户自己的语言,向用户展示了完整的思维链,这样他们就可以真正地阅读,看看它是否有意义。”
该公司发布了两个版本:拥有240亿个参数的开源模型Magistral Small;以及可通过Mistral API使用的更强大的专有系统Magistral Medium。
这些模型在训练过程中展现出了令人惊喜的能力。最值得注意的是,尽管训练过程仅侧重于基于文本的数学和编码问题,Magistral Medium仍保留了多模态推理能力——即分析图像的能力。
Lample表示:“我们意识到,这并非完全是意外,而是我们绝对没有想到的,如果在强化学习训练结束时,你重新插入初始视觉编码器,那么你会突然发现,模型能够对图像进行推理。”
这些模型还获得了复杂的函数调用能力,可以自动执行多步互联网搜索和代码执行来回答复杂的查询。Lample解释道,模型会像进行网络搜索一样,然后处理结果,甚至在需要时再次搜索。这种行为无需特殊训练即可自然形成,这让团队感到“非常惊喜”。
Mistral的技术团队克服了重大的工程挑战,创造了Lample所说的训练基础设施方面的突破。该公司开发了一套“在线强化学习”系统,使AI模型能够在生成响应的同时不断改进,而无需依赖现有的训练数据。
关键创新在于实时同步数百个图形处理单元(GPU)之间的模型更新。Lample解释说:“我们所做的就是找到一种方法,只需通过GPU即可完成模型的迁移。”这使得系统能够在几秒钟内(而不是通常需要的几小时)在不同的GPU集群之间更新模型权重。
Lample指出:“没有哪个开源基础设施能够像它一样妥善地做到这一点。通常情况下,有很多类似的开源尝试来做到这一点,但速度极其缓慢。而在这里,我们非常注重效率。”事实证明,训练过程比传统的预训练更快、更便宜,Lample表示,用不了一周就能完成。
Mistral Compute平台将运行在18,000块英伟达最新的Grace Blackwell芯片上,这些芯片最初部署在法国埃松省的一个数据中心,并计划扩展到整个欧洲。英伟达首席执行官黄仁勋表示,此次合作对于欧洲的技术独立至关重要。
黄仁勋在巴黎的联合声明中表示:“每个国家都应该在自己的国家建设人工智能,为本国服务。通过Mistral AI,我们正在开发模型和人工智能工厂,作为欧洲各地企业的自主平台,帮助企业在各个行业扩展智能。”黄仁勋预测,未来两年欧洲的人工智能计算能力将增长十倍,欧洲大陆将规划超过20个“人工智能工厂”。
此次合作不仅限于基础设施,还包括英伟达与其他欧洲人工智能公司以及搜索公司Perplexity合作,开发各种欧洲语言的推理模型,而这些语言的训练数据通常有限。
Mistral Compute解决了人工智能发展中的两大问题:环境影响和数据主权。该平台确保欧洲客户能够将其信息保存在欧盟境内并受欧洲管辖。
该公司与法国国家生态转型机构和领先的气候咨询公司Carbone4合作,评估并尽量减少其人工智能模型在整个生命周期内的碳足迹。Mistral计划使用脱碳能源为其数据中心供电,并表示“通过选择欧洲作为我们的工厂所在地,我们能够从大量脱碳能源中受益。”
早期测试表明,Mistral的推理模型不仅性能出色,而且解决了现有系统普遍存在的一个问题——速度。OpenAI和其他公司目前的推理模型可能需要几分钟才能响应复杂的查询,这限制了它们的实际应用。
Lample指出:“人们通常不喜欢这种推理模型的一点是,尽管它很智能,但有时也会耗费大量时间。而在这里,你实际上只需几秒钟就能看到输出,有时甚至不到五秒,有时甚至更短。这改变了体验。”速度优势对于企业采用来说至关重要,因为等待人工智能响应几分钟会造成工作流程瓶颈。
Mistral进军基础设施领域,使其与主导云计算市场的科技巨头展开直接竞争。该公司提供完整的垂直整合解决方案——从硬件基础设施到AI模型再到软件服务。这包括面向开发者的Mistral AI Studio、提升企业生产力的Le Chat和提供编程辅助的Mistral Code。
行业分析师认为,Mistral的战略是区域人工智能发展大趋势的一部分。黄仁勋表示:“欧洲若想保持全球竞争力,就迫切需要扩大其人工智能基础设施。”这与欧洲政策制定者的担忧不谋而合。
这一声明发布之际,欧洲各国政府越来越担心其在关键人工智能基础设施方面对美国科技公司的依赖。欧盟已承诺投入200亿欧元,在欧洲大陆建设人工智能“超级工厂”,而Mistral与英伟达的合作或将加速这些计划的实施。
Mistral宣布推出基础设施和模型功能,表明该公司致力于成为一个全面的AI平台,而不仅仅是一个模型提供商。在微软和其他投资者的支持下,该公司已筹集超过10亿美元,并将继续寻求额外资金来支持其业务范围的扩展。
Lample看到了推理模型未来更大的可能性,他表示:“当我观察内部进展时,我认为在一些基准测试中,该模型的准确率每周都在提高5%,大概持续了六周。所以它正在快速改进,有很多很多,我的意思是,你能想到的无数个小点子都能提升性能。”欧洲挑战美国人工智能主导地位的举措能否成功,最终可能取决于客户是否足够重视主权和可持续性,从而愿意放弃现有供应商。至少目前,他们还有选择。
Mistral AI与英伟达的合作旨在打造具有“主权”的AI基础设施和顶尖推理模型,以下是相关介绍:
合作背景与目标
-
增强技术主权:在美AI技术霸权引发的地缘焦虑中,欧洲希望通过减少对美国技术巨头的依赖,增强自身的技术主权。Mistral AI与英伟达的合作正是为了实现这一目标,通过建立本地化的AI基础设施,为欧洲企业提供自主可控的AI解决方案。
-
推动欧洲AI发展:法国总统马克龙将这一合作称为“历史性”的,认为它将增强法国和欧洲的技术主权,推动欧洲在人工智能领域的发展。英伟达CEO黄仁勋也表示,每个国家都应该在本国建立AI基础设施,以服务于本国企业和行业发展。
Mistral Compute平台
-
基础设施建设:Mistral AI计划在巴黎南部建设一个40兆瓦级AI数据中心,该数据中心将配备18000片英伟达Grace Blackwell芯片。这一平台名为Mistral Compute,将为政府机构和企业提供完整的AI基础架构,包括计算能力、软件解决方案、云API、托管服务和本地部署等。
-
技术优势:Mistral Compute将集成英伟达最先进的芯片技术,提供卓越的处理能力。该平台还注重可持续性和数据主权,符合欧洲的严格法规要求,并通过使用脱碳能源来减少环境影响。
-
市场定位:该平台旨在为欧洲、中东、亚洲以及南半球的行业和国家提供竞争优势,成为美国或中国云和AI提供商的替代方案。
推理模型开发
-
Mistral NeMo 12B模型:Mistral AI与英伟达此前已合作发布了Mistral NeMo 12B语言模型,该模型结合了Mistral AI在训练数据领域的专业知识与英伟达优化的软硬件生态系统,能够为各种应用提供高性能。
-
推理模型创新:Mistral AI的推理模型不仅在特定能力上达到美国主流产品的水准,还通过许可证创新实现了“可控开源”,企业客户既可以免费使用基础模型,也可以付费获得定制化硬件支持。
合作影响
-
重塑欧洲AI生态:这一合作可能通过加速主权技术的发展和为本地企业创造更具竞争力的环境,改变欧洲的人工智能生态系统。
-
全球市场拓展:Mistral AI的半数收入来自欧洲以外市场,包括日本和海湾国家,其商业模式正在重塑全球企业市场格局。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。