发布时间:2025-02-27 17:25:23 · 责任编辑:字母汇 · 浏览量:184 次
请先登录以使用聊天功能。
说明:1、对话聊天信息,保留三天;2、使用Qwen2.5-32B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,在数学、编程和推理等多个领域展现出卓越的性能。在 AIME 2024、MATH-500、GPQA Diamond 等多个基准测试中都取得了优异成绩,其中在 MATH-500 上达到了 94.3% 的准确率,展现出强大的数学推理能力。