首页 > 快讯 > 蚂蚁百灵发布开源高效思维框架,显著减少推理支出

蚂蚁百灵发布开源高效思维框架,显著减少推理支出

发布时间:2025-09-28 18:04:13 | 责任编辑:张毅 | 浏览量:12 次

蚂蚁百灵大模型团队近日宣布,正式开源两款全新的高效思考模型:Ring-flash-linear-2.0和 Ring-mini-linear-2.0。这些模型专为提高深度推理效率而设计,同时发布的还有两款自主研发的高性能融合算子,分别是 FP8融合算子和线性 Attention 推理融合算子,旨在实现 “大参数、低激活” 的高效推理与超长上下文支持。
根据团队介绍,得益于架构的优化与高性能算子的协同工作,这两款新模型在深度推理场景下的成本仅为同等规模的密集模型的十分之一,而与之前的 Ring 系列相比,推理成本也降低了超过50%。这意味着,用户在进行复杂推理时,可以大幅降低计算资源的消耗,提升工作效率。
新模型的优势不仅在于成本的降低,另外一个重要因素是其训练与推理引擎算子的高度对齐。这种对齐允许模型在强化学习阶段进行长周期、稳定且高效的优化,使得这些模型在多个高难度推理榜单中持续保持最佳表现(SOTA)。这无疑为使用者在需要进行复杂推理任务时提供了更强大的工具。
作为开源项目,Ring-flash-linear-2.0和 Ring-mini-linear-2.0已在多个平台上发布,包括 Hugging Face 和 ModelScope。对此,开发者们可以在这些平台上获取更多信息并进行尝试。
随着这次开源,蚂蚁百灵大模型团队不仅展示了其在 AI 领域的技术实力,也为广大开发者提供了更为高效的工具,助力他们在未来的 AI 开发与研究中取得更大的突破。

蚂蚁百灵发布开源高效思维框架,显著减少推理支出

这是一篇关于蚂蚁百灵推出开源高效思考模型,推理成本大幅降低的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐