首页 > 快讯 > 开源新模型 DeepCoder：超高效编程，超越OpenAI o1模型

开源新模型 DeepCoder：超高效编程，超越OpenAI o1模型

发布时间：2025-04-09 09:11:55 | 责任编辑：字母汇 | 浏览量：157 次

《开源新模型 DeepCoder：超高效编程，超越OpenAI o1模型》相关软件官网

在科技发展的浪潮中，人工智能（AI）技术日新月异。最近，由著名大模型训练平台 Together AI 和智能体平台 Agentica 联合开源的新模型 DeepCoder-14B-Preview，吸引了广泛关注。
该模型以仅有的140亿参数，在代码测试平台 LiveCodeBench 上的得分为60.6%，超过了 OpenAI 的 o1模型（59.5%），仅略低于 o3-mini(60.9%)。这一成绩在 Codeforces 和 AIME2024的评测中也表现出色，与 o1和 o3-mini 不相上下。
DeepCoder 不仅仅是一个新模型，其开源内容丰富，包含了模型权重、训练数据集、训练方法、训练日志及优化策略等，极大方便了开发者深入理解模型的开发流程。开源地址和相关的 GitHub 链接均已公布，便于有兴趣的开发者进行探索和研究。
DeepCoder 是在 Deepseek-R1-Distilled-Qwen-14B 基础上，通过分布式强化学习（RL）进行微调而成。为了构建高质量的训练数据集，研究团队收集了24，000个可验证的编程问题，并通过程序验证、测试过滤和去重等步骤确保数据质量。所有问题均通过外部官方解决方案进行验证，并满足严格的单元测试标准。
在代码强化学习训练过程中，DeepCoder 使用了两种沙盒环境来执行单元测试并计算奖励。Together Code Interpreter 环境高效且可扩展，能够支持大量并发沙盒，另外一个本地代码沙盒则确保了与现有排行榜的一致性。
DeepCoder 在奖励函数设计上采用了稀疏结果奖励模型，确保模型专注于生成高质量代码，而非通过记忆测试用例获取奖励。同时，为了实现更稳定的训练过程，模型采用了改进版的 GRPO 算法，并引入了迭代上下文扩展技术，显著提高了模型的推理能力。
为了加速端到端的 RL 训练，DeepCoder 团队还开源了优化扩展 verl-pipeline，通过一次性流水线技术，使训练、奖励计算和采样的过程完全流水化，大大提高了训练效率。
尽管 DeepCoder 刚刚开源，然而网友们对其表现非常赞赏，认为其是一个值得期待的开源项目。Together AI 成立于2022年，致力于提供高性能的 AI 模型和服务，最近还获得了3.05亿美元的融资，显示出其在行业中的强劲势头。

开源新模型 DeepCoder：超高效编程，超越OpenAI o1模型-项目/模型网址:
GitHub Hugging Face

开源新模型 DeepCoder：超高效编程，超越OpenAI o1模型

最新开源的 DeepCoder-14B-Preview 是由 Together AI 和 Agentica 联合发布的高效编程大模型，其在代码生成和推理能力上表现卓越，甚至超越了 OpenAI o1 模型。以下是该模型的核心亮点：

1. 性能超越OpenAI o1

LiveCodeBench 测试：DeepCoder 得分 60.6%，高于 OpenAI o1（59.5%），仅略低于 o3-mini（60.9%）。
Codeforces & AIME2024：在编程竞赛和数学推理测试中，DeepCoder 表现接近 OpenAI o1 和 o3-mini，展示了强大的代码生成和逻辑推理能力。

2. 完全开源，训练方法透明

不仅开源了 模型权重，还公开了 训练数据集、训练方法、优化日志，帮助开发者深入理解其开发流程。
基于 DeepSeek-R1-Distilled-Qwen-14B 微调，采用 分布式强化学习（RL） 优化。

3. 创新的训练技术

高质量数据集：包含 24K 可验证编程问题，涵盖 TACOVerified、PrimeIntellect 等数据集，并经过严格验证和去重。
奖励机制：采用 稀疏结果奖励模型（ORM），仅当代码通过所有测试才给予奖励，避免模型“作弊”。
GRPO+ 优化算法：改进的强化学习算法，提升训练稳定性，支持更长的上下文窗口（16K → 64K）。

4. 高效推理 & 低成本

流水线优化：使用 verl-pipeline 加速训练，减少 2 倍时间消耗，特别适合大规模代码任务。
沙盒环境：支持 100+ 并发执行，每分钟处理 1000+ 测试，确保高效推理。

5. 行业影响

李飞飞团队最新报告指出，中美AI模型性能差距正在缩小，DeepCoder 等开源模型的崛起加速了这一趋势。
开发者可免费使用 Hugging Face & GitHub 提供的模型，推动AI编程普及。

DeepCoder 的发布标志着 开源AI在代码生成领域的新突破，为开发者提供了媲美商业模型的强大工具。未来，随着更多优化和社区贡献，它有望成为编程AI的主流选择之一。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

下一篇：网信办：截至2025年3月31日已有346 款生成式AI服务完成备案

开源新模型 DeepCoder：超高效编程，超越OpenAI o1模型

1. 性能超越OpenAI o1

2. 完全开源，训练方法透明

3. 创新的训练技术

4. 高效推理 & 低成本

5. 行业影响

最新Ai信息

最新Ai工具

热门AI推荐