首页 > 快讯 > “问小白”揭幕第四版开源大型模型 XBai o4

“问小白”揭幕第四版开源大型模型 XBai o4

发布时间：2025-08-04 17:56:26 | 责任编辑：吴昊 | 浏览量：215 次

开源大模型领域迎来新突破。“问小白”正式发布其第四代开源模型 XBai o4，该模型在复杂推理能力上表现卓越，其 Medium 模式已全面超越 OpenAI o3-mini，并在部分基准测试中优于 Anthropic Claude Opus。
XBai o4引入了创新的“反思型生成范式”，通过结合 Long-CoT 强化学习和过程评分学习，实现了深度推理和高效推理链路筛选，同时显著降低了推理成本。
XBai o4的核心创新在于其独有的“反思型生成范式”（reflective generative form）。这一范式将 Long-CoT 强化学习与过程评分学习（Process Reward Learning）相结合，使得单个模型能够同时完成两个关键任务:
深度推理: 像人类一样进行多步骤的复杂思考。
高质量推理链路筛选: 能够评估和选择最优的推理路径。
更值得关注的是，XBai o4通过共享过程评分模型（PRMs）和策略模型的主干网络，将过程评分的推理耗时降低了99%。这一优化大幅提升了模型的运行效率，为实际应用提供了坚实基础。
XBai o4模型提供了三种模式（low、medium、high），以适应不同复杂度的任务需求。在多项关键基准测试中，其强大性能得到了充分验证:
在 Medium 模式下，XBai o4全面超越了 OpenAI 的 o3-mini 模型。
在部分基准测试中，其表现甚至优于 Anthropic 的 Claude Opus。
该模型在 AIME24、AIME25、LiveCodeBench v5、C-EVAL 等多个测试中均展现出卓越的推理能力。
“问小白”已在 GitHub 上开源了相关的训练和评估代码，这不仅为 AI 研究社区提供了宝贵的资源，也预示着开源大模型在复杂推理领域的竞争力正在迅速增强。
地址:https://github.com/MetaStone-AI/XBai-o4

“问小白”近日发布了第四代开源大模型 XBai o4（“o” 代表 “open”），该模型在复杂推理方面表现突出，Medium 模式下已全面超越 OpenAI-o3-mini，并在部分基准测试中优于 Anthropic Claude Opus。XBai o4 基于创新的 “反思型生成范式”（reflective generative form），融合了 Long-CoT 强化学习与过程评分学习（Process Reward Learning），使单个模型同时具备深度推理和高质量推理链路筛选能力，且显著降低了过程评分推理耗时。该模型提供三种模式（low、medium、high），在多个基准测试（如 AIME24、AIME25、LiveCodeBench v5、C-EVAL 等）中展现出强大性能，相关训练和评估代码已在 GitHub 开源。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：小米全面开放MiDashengLM-7B源代码：声音理解成就新巅峰，推理效能跃升20倍

下一篇：问小白发布XBai o4开源大模型：革命性的反思型推理设计彻底改变行业格局，全面超越OpenAI o3-mini性能

“问小白”揭幕第四版开源大型模型 XBai o4

最新Ai信息

最新Ai工具

热门AI推荐