首页 > 快讯 > 微博推出Vibe Thinker开源项目:以15亿参数超越DeepSeek R1,后训练仅需7800美元成本
微博推出Vibe Thinker开源项目:以15亿参数超越DeepSeek R1,后训练仅需7800美元成本
发布时间:2025-11-18 20:22:27 | 责任编辑:吴昊 | 浏览量:2 次
微博正式发布自研开源大模型Vibe Thinker,凭借 15 亿参数在国际顶级数学竞赛基准测试中击败 6710 亿参数的DeepSeek R1,准确率领先且单次“后训练”成本仅 7800 美元,比DeepSeek-R1 和MiniMax-M1 等模型低数十倍。
Vibe Thinker采用轻量化MoE架构与多轮知识蒸馏,官方称在5GB以下数学语料上即可完成高效微调,支持Hugging Face一键下载及商用许可。微博技术团队透露,模型在AIME 2025、HMMT等竞赛题库中平均得分较R1 提升3.4%,推理延迟降低42%,适用于教育、金融等实时场景。
开源版本提供PyTorch与GGUF格式,最低可在单张RTX4090 运行。微博同步开放训练脚本与数据配比方案,计划 12 月推出Vibe Thinker-Math专用数学增强版,并联合高校举办“轻量级数学挑战赛”,推动低成本高精度AI普及。
微博推出Vibe Thinker开源项目:以15亿参数超越DeepSeek R1,后训练仅需7800美元成本
这是一篇关于微博开源Vibe Thinker:15亿参数击败DeepSeek R1,后训练成本仅7800美元的文章,内容值得关注。
©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
