昆仑万维开源Skywork-OR1系列模型 数学代码能力出色
发布时间:2025-04-14 09:39:02 | 责任编辑:字母汇 | 浏览量:15 次
4月13日,昆仑万维天工团队宣布推出全新升级的Skywork-OR1(Open Reasoner1)系列模型,这是继2025年2月发布首款中文逻辑推理大模型Skywork-o1之后的又一力作。该系列模型在同等参数规模下实现了业界领先的推理性能,进一步突破了大模型在逻辑理解与复杂任务求解方面的能力瓶颈。
此次开源的Skywork-OR1系列模型包括三款高性能模型:Skywork-OR1-Math-7B聚焦数学领域的专项模型,同时也具备较强的代码能力;Skywork-OR1-7B-Preview融合数学与代码能力,兼具通用性与专业性;Skywork-OR1-32B-Preview则是面向更高复杂度任务、具备更强推理能力的旗舰版本。
在竞赛编程任务中,通用模型Skywork-OR1-7B-Preview与Skywork-OR1-32B-Preview在LiveCodeBench数据集上均取得了同等参数规模下的最优性能。Skywork-OR1-32B-Preview表现尤为突出,其代码生成与问题求解能力已接近DeepSeek-R1(参数规模高达671B),在大幅压缩模型体量的同时实现了卓越的性价比,充分展现出天工团队训练策略的先进性。
Skywork-OR1系列模型的显著性能突破离不开天工团队在模型后训练阶段的长期自研积累与技术深耕。在数据选择和预处理方面,Skywork-OR1构建了一个高质量数学和代码数据集,用于强化学习以提升模型在数学和代码领域的推理能力。团队根据可验证性、正确性与挑战性三个标准进行初步数据筛选,剔除无法自动验证的证明类题目、有误题目和缺少unit test的代码问题。在数据过滤方面,为避免“全对”或“全错”现象对策略学习无效,每道题进行了多轮采样并验证答案,并基于模型表现过滤难度极端的题目。
此外,Skywork-OR1采用了Group Relative Policy Optimization (GRPO)进行模型训练,并引入了训练时数据优化、训练Pipeline优化、训练时模型探索和训练Loss优化等多项优化措施。
Skywork-OR1系列开源地址:
GitHub
昆仑万维开源的Skywork-OR1系列模型在数学和代码能力方面表现出色,以下是相关介绍:
模型概述
Skywork-OR1系列模型是昆仑万维天工团队基于首款中文逻辑推理大模型Skywork-o1升级而来,于2025年4月13日推出。该系列涵盖三款高性能模型:
- Skywork-OR1-Math-7B:专注于数学推理的专项模型,同时具备较强的代码能力。
- Skywork-OR1-7B-Preview:融合数学与代码能力,兼具通用性与专业性。
- Skywork-OR1-32B-Preview:面向更高复杂度任务,具备更强推理能力的旗舰版本。
数学能力
- 数据集表现:在AIME24与AIME25数据集上,Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview均实现了同参数规模下的最优表现。专项模型Skywork-OR1-Math-7B在AIME24和AIME25上分别取得69.8%和52.3%的高分,远超当前主流7B级别模型。
- 技术亮点:该系列模型通过多阶段GRPO训练,在复杂数学问题上实现了卓越表现。在数据选择和预处理方面,构建了高质量数学数据集,主要依赖NuminaMath-1.5,并选用AIME和Olympiads等较难子集,补充了如DeepScaleR、Omni-MATH、AIME 1983-2023难题来源。
代码能力
- 数据集表现:通用模型Skywork-OR1-7B-Preview与Skywork-OR1-32B-Preview在LiveCodeBench数据集上均取得了同等参数规模下的最优性能。Skywork-OR1-32B-Preview的代码生成与问题求解能力已接近DeepSeek-R1(参数规模高达671B),展现出极高的性价比。
- 技术亮点:尽管Skywork-OR1-Math-7B训练过程中未专门针对代码能力进行优化,但在代码评测基准Livecodebench上从37.6%提升到43.6%,表明训练方法具有较好的领域泛化性。在数据选择和预处理方面,以LeetCode和TACO数据为主,保留了单元测试完整、验证通过的问题,并进行向量级语义去重。
开源策略
此次发布的Skywork-OR1系列采用业界最高透明度的开源策略,全面开源了模型权重、训练数据集和完整训练代码,所有资源均已上传至GitHub和Huggingface平台。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
上一篇: 人工智能如何影响隐私保护?
下一篇: AI 的工作原理是什么?