DeepSeek 推出全新开源R1-0528 模型,性能比肩OpenAI o3
发布时间:2025-05-29 09:51:33 | 责任编辑:张毅 | 浏览量:14 次
今天凌晨,知名的开源大模型平台 DeepSeek 发布了其最新版本 R1(0528),引起了广泛关注。此次发布没有附带详细说明,DeepSeek 选择了 “悄然” 开放模型,预计后续会发布模型卡,进一步介绍其功能。
据悉,R1-0528版本的性能在著名代码测试平台 Live CodeBench 上的测试结果显示,其表现与 OpenAI 最新的 o3模型相当。很多网友对此表示期待,纷纷对新版本进行了测试,发现新版 R1在风格和表现上都与 OpenAI 的 o3模型相似。
具体来说,R1-0528在专业风格的响应方面,显示出了 o3-2.5的特征。无论是在使用箭头和星号的方式上,还是在结尾部分 “why it works” 的表述上,R1都展现出了很高的说服力。虽然 OpenAI 在不断努力提升其模型性能,但 DeepSeek 的 R1依然表现得相当出色,令人期待其后续版本 R2的智能表现。
Hyperbolic Labs 的联合创始人兼首席执行官也表示,R1依旧是能精确回答 “9.9” 和 “9.11哪个更大” 的模型,这一能力凸显了其高水平的智能表现。此外,知名 AI 评论人 Haider 也对新版本 R1赞不绝口,他提到,在一次编程挑战中,R1成功构建了一个单词评分系统,并提供了整洁的代码和可运行的测试用例,首次运行便完美通过。
Haider 指出,以前只有 o3模型能够完成这样的任务,而现在 DeepSeek 的 R1也达到了这样的水平。他表示,尽管模型的思考时间似乎有所延长,但其智能水平却令人惊叹。随着测试的深入,大家不禁思考,DeepSeek 是否在有意将此次 R1版本作为过渡,以防止后续 R2的发布让用户失望。
新版 DeepSeek R1表现不俗,不仅能够像 o3一样进行思维链的自我纠正,还具备了类似 Claude 的创造性构建能力,这是之前版本所不具备的。随着官方模型卡的发布,AIGC 开放社区也将为大家带来更深入的解析,期待未来的更多惊喜。
开源地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
划重点:
🌟 新版 DeepSeek R1(0528)开源,性能媲美 OpenAI o3模型。
💻 测试显示 R1在编程能力上表现出色,成功完成复杂任务。
🔍 期待 DeepSeek 后续发布模型卡,深入解析新版本功能。
DeepSeek 的 R1-0528 模型在最近的更新中表现出了显著的性能提升,被认为可以与 OpenAI 的 o3 模型相媲美。以下是两者的对比:
性能表现
-
推理能力:DeepSeek R1-0528 在推理任务上表现出色,特别是在数学和逻辑推理方面。例如,在 LiveCodeBench 测试中,其表现几乎与 OpenAI o3-high 相当。此外,它还能正确解答一些复杂的数学问题,如“9.9 - 9.11 = ?”,而这些问题曾难倒了包括 o3 在内的其他一些顶流大模型。
-
响应速度:目前没有明确的对比数据,但根据之前的测试,DeepSeek R1 在推理任务中响应速度相对较慢,例如在编码任务中需要 1 分 45 秒,而 OpenAI o3-mini 只需 27 秒。不过,R1-0528 是否在响应速度上有所改进尚未可知。
技术架构
-
DeepSeek R1-0528:采用了混合专家方法,每个 token 仅激活参数子集。这种架构使得模型在处理复杂任务时更具成本效益。
-
OpenAI o3:使用密集的转换器模型,用全套参数处理每个 token。这种架构使得 o3 在处理任务时更加一致和快速。
开源与成本
-
DeepSeek R1-0528:完全开源,采用 MIT 许可协议,任何人都可以自由地使用、修改、分发和商业化该模型。此外,其成本相对较低,每百万输入 token 的成本约为 0.14 美元(如果使用缓存命中),每百万输出 token 的成本约为 2.19 美元。
-
OpenAI o3:并非开源模型。其成本相对较高,例如 o3-mini 每百万输入 token 的成本约为 1.10 美元,每百万输出 token 的成本约为 4.40 美元。
应用场景
-
DeepSeek R1-0528:更适合需要复杂推理和长思考时间的任务,例如数学问题解决、代码生成和科学推理。
-
OpenAI o3:在多模态处理和通用对话方面表现更出色,适合需要快速响应和多模态交互的应用。
总体而言,DeepSeek R1-0528 在推理能力上已经接近甚至在某些任务上超越了 OpenAI o3,并且其开源和低成本的特点使其在某些应用场景中更具优势。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。