首页 > 快讯 > 小米发布首个推理大模型Xiaomi MiMo,具备70亿参数并实现开源

小米发布首个推理大模型Xiaomi MiMo,具备70亿参数并实现开源

发布时间:2025-04-30 13:59:18 | 责任编辑:吴昊 | 浏览量:6 次

全球知名科技公司小米正式发布其首个针对推理(Reasoning)而生的大型开源模型 ——Xiaomi MiMo。该模型旨在解决当前预训练模型在推理能力上的瓶颈,探索如何更有效地激发模型的推理潜能。MiMo 的推出标志着小米在人工智能领域的一次重要尝试,尤其是在数学推理和代码竞赛方面,表现出色。
** Xiaomi MiMo 的显著优势 **
据小米介绍,MiMo 在数学推理(AIME24-25)和代码竞赛(LiveCodeBench v5)的公开测评中,仅以7亿参数的规模便超越了 OpenAI 的闭源推理模型 o1-mini 和阿里巴巴的开源推理模型 QwQ-32B-Preview。此成绩不仅彰显了 MiMo 在推理任务上的优越性能,更为行业树立了新的标杆。
随着 DeepSeek-R1的推出,强化学习(RL)在业界引发了共创潮流。MiMo-7B 在相同的强化学习训练数据条件下,其在数学与代码领域的推理能力明显领先于现有的经典开源32B 模型,如 DeepSeek-R1-Distill-7B 和 Qwen2.5-32B。这样的成绩不仅展示了小米在算法和模型训练上的创新能力,更为其未来的 AI 发展奠定了坚实基础。
** 独特的训练方法推动推理能力提升 **
MiMo 的推理能力提升源于预训练与后训练阶段的多层面创新。在预训练阶段,MiMo 通过整合丰富的推理语料,合成了约200B tokens 的推理数据。训练过程中,小米采取了三阶段训练的方法,逐步增加训练难度,总共训练了25T tokens,以确保模型在复杂推理任务上的表现。
在后训练阶段,小米则聚焦于高效且稳定的强化学习算法和框架。通过引入 “测试难度驱动奖励”(Test Difficulty Driven Reward)策略,MiMo 有效解决了在困难算法问题中奖励稀疏的问题。同时,采用 “简单数据重采样”(Easy Data Re-Sampling)策略,提升了强化学习训练的稳定性和有效性。为了加速训练过程,小米还设计了无缝回放系统,使得 RL 训练速度提高了2.29倍,验证速度提升了1.96倍。
** 全面开源与未来展望 **
小米 MiMo 全系列的模型已开源至 HuggingFace 平台,用户可以方便地访问和使用这一前沿技术,具体链接为:[HuggingFace MiMo-7B](https://huggingface.co/XiaomiMiMo)。小米表示,MiMo 是其全新成立的大模型核心团队的初步尝试,尽管2025年似乎是大模型发展的后半程,但小米始终相信,通往通用人工智能(AGI)的道路仍然漫长且充满挑战。
小米将继续秉持务实创新的原则,勇敢探索未知领域,以思考突破智能的边界,回应每一次的好奇心。通过 MiMo,小米不仅希望推动人工智能技术的发展,更希望在未来的智能生活中,为用户带来更多可能性。

小米发布首个推理大模型Xiaomi MiMo,具备70亿参数并实现开源

小米于2025年4月30日正式开源了其首个推理大模型 Xiaomi MiMo。该模型专注于推理能力,拥有70亿参数规模,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)的公开测评中,表现优于OpenAI的闭源模型o1-mini和阿里巴巴的QwQ-32B-Preview。

技术亮点

  • 预训练阶段:MiMo着重挖掘富含推理模式的语料,合成了约2000亿tokens的推理数据,并通过三阶段训练逐步提升难度,累计训练量达到25万亿tokens。

  • 后训练阶段:采用创新的强化学习算法和框架,提出Test Difficulty Driven Reward机制,缓解了困难算法问题中的奖励稀疏问题,并引入Easy Data Re-Sampling策略以稳定训练。此外,设计的Seamless Rollout系统使训练速度提升2.29倍,验证速度加快1.96倍。

开源信息

MiMo全系列模型(包括MiMo-7B-Base、MiMo-7B-SFT、MiMo-7B-RL等)已开源至HuggingFace,开发者可以免费调用并根据需求进行微调。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复