DeepConf 由 Meta 和 UCSD 推出:AI 推理精度接近完美,同时将计算成本削减 85%
发布时间:2025-09-01 09:42:45 | 责任编辑:张毅 | 浏览量:23 次
在人工智能的快速发展中,Meta 与加州大学圣地亚哥分校(UCSD)合作,推出了一项名为 “DeepConf” 的创新技术。这项新技术在高难度推理题的准确性和计算成本方面取得了突破性的进展,成为业界关注的焦点。
DeepConf 解决了长期以来困扰人工智能领域的一个核心问题:如何在进行复杂推理时保持高准确率的同时,降低计算资源的消耗。此次技术的推出,尤其是在 AIME2025数学竞赛中的表现,更是让人惊叹。DeepConf 与开源的 GPT-OSS-120B 模型结合,取得了高达99.9% 的准确率,并成功将计算资源的使用减少了84.7%。
传统的推理方法往往依赖于生成大量不同解题思路,然后进行投票选出最佳答案。然而,这种方法在准确性和计算开销上面临重大挑战。Meta 与 UCSD 的研究团队指出,过多的解题路径可能导致效益递减,甚至可能由于低质量答案影响最终结果。此外,传统方法还需要消耗大量计算资源,这在经济上并不可行。
DeepConf 通过引入 “置信度” 机制,改变了传统的推理模式。AI 在解题过程中会对每一步的信心进行评估,如果发现某一步骤的信心不足,就会及时停止并调整解题策略。这种灵活的动态调整机制,不仅提高了最终结果的准确性,还有效节省了计算资源。
在 AIME 等顶级数学竞赛中,DeepConf 的表现证明了其有效性。与传统方法相比,DeepConf 的组合不仅在准确率上显著提升,而且生成的总令牌数减少了84.7%。这意味着,在取得优异成绩的同时,DeepConf 也为计算中心节省了大量的电力消耗,展现了其在 AI 推理领域的潜力和创新。
随着 DeepConf 的发布,人工智能的推理能力将迎来新的发展机遇,未来 AI 在复杂任务中的应用前景更加广阔。
论文:https://arxiv.org/abs/2508.15260
划重点:
🔍 DeepConf 技术在高难度推理任务中实现了99.9% 的准确率。
💡 计算资源消耗减少了84.7%,大幅降低了运算成本。
🚀 通过 “置信度” 机制,AI 能够动态调整解题策略,提升推理效率。
。
核心创新:基于“自信度”的动态推理路径筛选
传统方法(如自一致性)通过生成多条推理路径并进行多数投票来提升准确率,但计算成本高且路径质量不均。DeepConf 的核心创新在于:
-
实时监控置信度:在推理过程中,模型实时评估每条路径的“自信度”(confidence),低置信度路径被动态淘汰,高置信度路径则加权投票
。
-
无需额外训练:该方法无需微调或超参数调整,即插即用,兼容任何现有模型
。
实验结果:准确率与效率的双重提升
-
离线模式:在 AIME 2025 数据集上使用 GPT-OSS-120B 模型,准确率达到 99.9%,显著优于标准多数投票的 97.0% 和单路径的 91.8%
。
-
在线模式:通过实时终止低置信度路径,token 生成量减少高达 84.7%,同时保持或提升准确率。例如,在 DeepSeek-8B 模型上,AIME24 数据集的 token 量减少 77.9%,准确率从 86.7% 提升至 92.5%
。
应用前景
。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。