小米 MiMo

HuggingFace ModelScope

国家/地区：中国🇨🇳

AI功能描述：Xiaomi MiMo，是小米首个推理大模型，联动预训练到后训练，全面提升推理能力

说明: 官网入口 官方网站主页； IOS App Store 下载，支持 iPhone/iPad/Mac；安卓 Google Play / 应用宝下载； 客户端 Mac/Windows/iOS/Android 官方下载；插件浏览器插件（默认 Chrome）； GitHub / HuggingFace / ModelScope 模型或项目托管地址； API 模型/软件接口地址； MCP 官网的 MCP 栏目入口。若未显示，表示暂无对应渠道，欢迎补充或纠错。

AIGC官网收录 │ 2025-05-15 │ 201 次 │ 人工核对 │ 官网认证 │ 定期更新 │ AI大模型

小米 MiMo 图文介绍：

Xiaomi MiMo，是小米首个推理大模型，联动预训练到后训练，全面提升推理能力，于2025年4月30日开源。
MiMo来自全新成立不久的小米大模型Core团队的初步尝试。在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

主要功能

MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo 仅用 7B 的参数规模，超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
在相同RL训练数据情况下，MiMo-7B 的数学&代码领域的强化学习潜力显著领先。
预训练+后训练，联动提升推理能力MiMo推理能力的提升，由预训练和后训练阶段中数据和算法等多层面的创新联合驱动，包括：

预训练：核心是让模型见过更多推理模式
数据：着重挖掘富推理语料，并合成约200B tokens推理数据。
训练：进行了三阶段训练，逐步提升训练难度，总训练25T tokens。
后训练：核心是高效稳定的强化学习算法和框架
算法：提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题，并引入 Easy Data Re-Sampling 策略，以稳定 RL 训练。
框架：设计了Seamless Rollout系统，使得RL训练加速2.29倍，验证加速1.96倍。

©️版权声明：
本网站(AIGC官网)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。