阿里巴巴ZeroSearch技术实现AI训练成本锐减88%,彻底革新行业模式
发布时间:2025-05-09 09:54:36 | 责任编辑:张毅 | 浏览量:47 次
阿里巴巴集团研究人员近日推出一项名为"ZeroSearch"的突破性技术,彻底改变了训练人工智能系统搜索信息的方式。这项创新技术通过模拟方法让大型语言模型(LLM)开发高级搜索功能,无需在训练过程中与真实搜索引擎交互,从而消除了对昂贵商业搜索引擎API的依赖。
ZeroSearch解决了AI行业面临的两大关键挑战:搜索引擎返回文档质量的不可预测性,以及向谷歌等商业搜索引擎进行数十万次API调用所产生的高昂成本。
研究人员在本周发表于arXiv的论文中指出:"强化学习[RL]训练需要频繁部署,可能涉及数十万个搜索请求,这会产生大量的API开销,并严重限制可扩展性。为了应对这些挑战,我们推出了ZeroSearch,这是一个强化学习框架,无需与真实搜索引擎交互即可激励LLM的搜索能力。"
阿里巴巴的方法首先采用轻量级的监督式微调,将LLM转换为能够根据查询生成相关和不相关文档的检索模块。在强化学习训练过程中,系统采用"基于课程的推出策略",逐步降低生成文档的质量。
研究人员解释道:"我们的关键见解是,LLM在大规模预训练过程中获得了广泛的世界知识,能够根据搜索查询生成相关文档。真实搜索引擎和模拟LLM之间的主要区别在于返回内容的文本风格。"
在七个问答数据集的全面测试中,ZeroSearch不仅匹敌,甚至经常超越使用真实搜索引擎训练的模型。令人印象深刻的是,一个70亿参数的检索模块实现了与谷歌搜索相当的性能,而140亿参数的模块甚至超越了后者。
成本节省更是显著:通过SerpAPI使用Google搜索进行约64,000个查询的训练成本约为586.70美元,而在四台A100GPU上使用14B参数模拟LLM的成本仅为70.80美元,节省了88%的费用。
论文结论指出:"这证明了在强化学习设置中使用训练有素的LLM替代真实搜索引擎的可行性。"
这一突破标志着AI训练方式的重大转变。ZeroSearch表明,AI系统可以通过自我模拟而非依赖外部工具来实现功能改进,为行业带来多重益处:
研究团队已在GitHub和Hugging Face上公开了相关代码、数据集和预训练模型,鼓励行业广泛采用这一创新方法。
随着大型语言模型继续发展,ZeroSearch这样的技术预示着未来AI系统将能通过自我模拟而非依赖外部服务来开发更复杂的功能,这可能从根本上改变AI开发的经济性并减少对大型技术平台的依赖。
讽刺的是,在教AI无需搜索引擎进行搜索的过程中,阿里巴巴可能创造了一项让传统搜索引擎对AI发展不再那么重要的技术。随着这些系统变得更加自给自足,技术格局可能在未来几年内发生巨大变化。
阿里巴巴的ZeroSearch技术通过创新的训练模式,显著降低了AI训练成本并提升了搜索性能,以下是其核心内容:
技术原理
ZeroSearch是一种基于强化学习框架的大模型搜索引擎,无需与真实搜索引擎交互即可激发大模型的搜索能力。它利用大模型在大规模预训练过程中积累的知识,将其转化为高效的检索模块,能够根据搜索查询生成相关内容,并动态控制生成内容的质量。
成本降低
传统搜索引擎训练依赖昂贵的API调用,例如通过SerpAPI进行约64,000次搜索查询的训练成本高达586.70美元。而ZeroSearch通过在四个A100 GPU上模拟140亿参数的大模型,仅需70.80美元,成本降低了88%。
性能提升
在多个问答数据集(如NQ、TriviaQA、PopQA、HotpotQA等)的测试中,ZeroSearch的性能显著提升。70亿参数的监督微调模型搜索能力达到33.06,140亿参数的模型达到33.97,超过了谷歌搜索的32.47。
创新训练方法
-
轻量级监督微调:将大模型转化为检索模块,生成相关或噪声文档,为后续训练提供多样化检索场景。
-
课程学习机制:通过动态调整生成文档的质量,逐步增加任务难度,提升模型的推理能力和鲁棒性。
-
多轮交互模板:明确区分模型的推理、搜索和回答阶段,提高透明度和可靠性。
行业影响
ZeroSearch的开源发布为AI行业带来了重大变革:
-
降低门槛:大幅降低API调用成本,使高级AI训练更加平民化。
-
增强控制:开发者可精确控制训练信息,减少对搜索引擎结果不确定性的依赖。
-
广泛适用:已在多个模型系列上验证,包括Qwen-2.5和LLaMA-3.2。
ZeroSearch不仅展示了阿里巴巴在AI领域的技术实力,也为未来AI系统的发展提供了新的方向。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。