首页 > 快讯 > 阿里ZeroSearch突破：AI无需搜索引擎自主”谷歌式”学习，成本骤降近九成

阿里ZeroSearch突破：AI无需搜索引擎自主”谷歌式”学习，成本骤降近九成

发布时间：2025-05-09 14:59:43 | 责任编辑：吴昊 | 浏览量：103 次

想象一下，如果AI不再依赖谷歌搜索、Bing搜索这些“外包助手”，而是自带“搜索引擎大脑”自我检索、自我学习，结果表现还更优秀——你是不是觉得这听起来像是《黑客帝国》第二集?但阿里真的做到了!
这不只是一次技术突破，更像是一次“AI自给自足革命”的打响第一枪。ZeroSearch 的出现，可能正悄悄改变我们构建智能系统的底层逻辑。
“用强化学习训练一个AI助手，光是搜索费用就能掏空初创公司的预算。”
这不是夸张，而是现实——训练一个需要频繁搜索外部信息的大语言模型（LLM），背后少不了一大堆 Google API 请求。每一条搜索请求都在烧钱，有时甚至得调用几十万次，最后账单吓到程序员直接转行。
于是，阿里巴巴研究团队做了个大胆决定:干脆，不用搜索引擎了!
他们打造了一种名为 ZeroSearch 的新型强化学习训练框架，核心思路是:让 LLM 自己假装是搜索引擎，自己生成“相关”和“无关”的文档来喂自己学。听起来像是“左手喂右手”，但效果惊人——不仅省下了88%的训练成本，还能超过真实搜索引擎训练出的模型。
这波啊，直接让搜索引擎从“刚需”变成了“可选项”。
你可能会疑惑:不用谷歌，AI怎么知道去哪儿找信息?
ZeroSearch 的核心秘密在于——大语言模型早就“见过世面”。
在大规模预训练时，LLM 已经吞下了互联网上的海量文本，也就是说，它脑海中已经有一个“世界知识图谱”，只是以前没人告诉它怎么用这个图谱来检索。ZeroSearch 所做的，就是通过一点点“监督微调”，教它如何根据问题“模拟”出一批可能相关的文档，然后自己再判断哪些靠谱、哪些不靠谱。
这相当于:不给它地图，它自己画一张;不给它新闻，它自己写一篇;不给它链接，它自己编一个……关键是，它编的还挺准!
更妙的是，研究人员采用了“课程式训练”方法，一开始让模型学得轻松点，文档都是高质量的。随着训练推进，文档会逐渐变得“嘈杂”、不相关，难度升级，最终让模型练就火眼金睛，具备在信息噪声中找出关键内容的能力。
“成本低、效果好，还摆脱了对谷歌的依赖”——这三句话，足以让AI初创公司眼前一亮。
以前要训练一个能问答、能检索、能推理的AI助手，你得花大价钱买搜索 API，还得承受返回内容质量波动的风险。而现在，ZeroSearch 带来了一个新范式:
彻底消除搜索 API 成本:一条谷歌 API 要几分钱，几十万条就是上千美元;而用 ZeroSearch，在本地模拟，一次训练只需不到一百美元;
训练过程更可控:你可以精确设计训练数据的质量，避免被搜索引擎随机返回的奇怪结果“带歪节奏”;
性能甚至更强:实验证明，在多个问答数据集上，ZeroSearch 训练出的模型性能已经超过使用真实搜索引擎训练的模型。
这意味着什么?意味着 AI 不再是“有钱人的游戏”。
过去，大厂靠 API 掌握了技术生态入口，小厂想玩只能“靠边站”。而现在，小型团队也可以自己训练高水平的 AI 模型，门槛被极大地拉低了。
你以为 ZeroSearch 只是优化训练流程?其实它动摇的是整个 AI 开发的底层依赖。
这就像汽车工业不再依赖加油站，而转向了太阳能和电池:不仅便宜，还更自主、灵活。未来我们可能会看到，越来越多的 AI 系统具备内建检索、评估、自我学习的能力，像是自带“谷歌脑”的智能体。
RAG（Retrieval-Augmented Generation，检索增强生成）模式在过去几年大红大紫，但它一直建立在“搜索引擎+LLM”的基础上。而 ZeroSearch 的崛起，让人开始重新思考:也许最好的 RAG，根本不需要真正的“R”?
当然，ZeroSearch 并不是完美无缺。模拟搜索引擎的 LLM 依然需要 GPU 支撑，这意味着你要花点钱租服务器。但和动辄几千美元的 API 费用比起来，已经是白菜价了。
科技发展中，总会有一些技术让人产生“啊，这下真的不一样了”的感觉。ZeroSearch 正是这样一种存在。
它打破了我们对“AI必须依赖外部知识源”的想象，提供了一种更高效、更经济、更自由的训练路径。它背后代表的，是 AI 正在从“数据消费者”转变为“知识制造者”的新阶段。
未来的智能体，也许会像人类一样，从模仿中学习，从经验中成长，不再需要每次都去“问别人”，而是自己思考、自己判断、自己行动。
而 ZeroSearch，不只是让 AI 学会“自我谷歌”，更让我们看到:真正强大的智能，从来不是依赖谁，而是靠自己进化而来。
如果你也是正在开发 AI 的创业者、工程师或产品经理，不妨问自己:你的 AI，还在“借搜索过日子”?还是，已经准备好走向“自力更生”的新时代?
ZeroSearch项目入口：https://top.aibase.com/tool/zerosearch

阿里巴巴的 ZeroSearch 技术确实是一项具有重大意义的创新，以下是关于它的详细介绍：

技术原理

无需与真实搜索引擎交互：ZeroSearch 是一种强化学习框架，基于大模型在大规模预训练过程中积累的丰富知识，将其转化为一个检索模块。该模块能够根据搜索查询生成相关内容，无需与谷歌等真实搜索引擎进行交互。
动态控制文档质量：ZeroSearch 可以动态控制生成文档的质量，支持生成相关或噪声文档。通过调整提示模板中的关键词，引导模型学习质量分级检索，为训练提供多样化的检索场景。
轻量级监督微调与课程学习机制：先将大模型转化为检索模块，使其能生成高质量或低质量文档，适应不同训练需求。在训练中逐步增加文档噪声水平，让模型从简单场景开始，逐步适应更具挑战性的任务，提升推理能力。
基于 F1 分数的奖励机制：用 F1 分数作为奖励信号，专注于答案准确性。
多轮交互模板：设计明确的推理、搜索和回答阶段，引导模型逐步完成任务。

性能与成本优势

性能表现：研究人员在 NQ、TriviaQA、PopQA、HotpotQA 等 7 大问答数据集上进行了综合评测。结果显示，一个 70 亿参数的监督微调模型使用 ZeroSearch 后，其搜索能力达到了 33.06；140 亿参数的模型则达到了 33.97，超过了谷歌搜索的 32.47。
成本效益：研究人员通过 SerpAPI 使用谷歌搜索进行约 64,000 次搜索查询的训练，成本约为 586.70 美元；而在四个 A100 GPU 上使用 140 亿参数的大模型进行模拟时，成本仅为 70.80 美元，成本降低了 87.93%。

对 AI 行业的影响

降低进入门槛：对于预算有限的初创公司和研究团队，API 调用成本降低近 90% 使高级 AI 训练更加平民化。
增强控制能力：开发者可以精确控制 AI 训练过程中接触的信息，不再受制于搜索引擎返回结果的不确定性。
适用性广泛：该技术已在多个模型系列上得到验证，包括 Qwen-2.5 和 LLaMA-3.2 的基础版本和指令调整版本。

ZeroSearch 的出现，不仅降低了 AI 训练的成本，还提高了训练的可控性和模型的性能，为 AI 行业的发展带来了新的机遇和可能性。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。