阿里推出开源ZeroSearch引擎:训练费用骤降八成
发布时间:2025-05-09 09:09:29 | 责任编辑:吴昊 | 浏览量:23 次
近日,阿里巴巴推出了一款名为 ZeroSearch 的开源创新大模型搜索引擎,这一新工具通过强化学习框架,极大地提高了搜索能力,并且在训练过程中不需要与真实搜索引擎互动。ZeroSearch 的核心优势在于它能够利用大型预训练模型的知识,快速生成相关内容,并且可以动态控制生成内容的质量。
与传统的搜索引擎相比,ZeroSearch 的训练成本显著降低。据了解,使用 SerpAPI 进行传统搜索引擎的训练费用高达586.70美元,而通过四个 A100GPU 模拟一个140亿参数的大模型,所需的训练成本仅为70.80美元,这一降幅超过了80%。这样的成本节约无疑为广泛的应用和开发提供了更多可能。
ZeroSearch 的设计旨在解决当前搜索引擎在响应速度和内容相关性上的一些局限性。它能够基于历史数据和预训练模型进行快速推理,生成用户所需的信息。这意味着用户在进行搜索时,能够得到更快速且相关性更高的结果,提升了整体用户体验。
阿里巴巴开源 ZeroSearch 的发布,不仅展示了其在人工智能领域的深厚积累和技术实力,同时也为开发者和企业提供了一个强大的工具,帮助他们在搜索引擎优化、信息检索等多个方面取得突破。未来,ZeroSearch 有望为更多行业带来创新的解决方案。
阿里巴巴开源的 ZeroSearch 是一种创新的大模型搜索引擎,其训练成本大幅降低,性能甚至超过了谷歌搜索。
技术原理
ZeroSearch 采用了强化学习框架,无需与真实搜索引擎交互即可激励大模型的搜索能力。它利用大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容,并动态控制生成内容的质量。
成本优势
在成本方面,研究人员通过 SerpAPI 使用谷歌搜索进行约 64,000 次搜索查询的训练,成本约为 586.70 美元;而使用 ZeroSearch,在四个 A100 GPU 上使用 140 亿参数的大模型进行模拟时,成本仅为 70.80 美元,成本降低了 80% 以上。
性能表现
在 NQ、TriviaQA、PopQA、HotpotQA 等 7 大问答数据集上进行的综合评测显示,一个 70 亿参数的监督微调模型使用 ZeroSearch 后,其搜索能力达到了 33.06;140 亿参数的模型则达到了 33.97,超过了谷歌搜索的 32.47。
应用前景
ZeroSearch 的开源为许多企业尤其是初创公司提供了强大的工具,大幅降低了搜索引擎的开发与维护成本。其灵活的定制化解决方案和开源战略,预计将吸引更多企业和开发者参与,推动搜索引擎技术的发展。
ZeroSearch 的开源地址为:https://github.com/Alibaba-nlp/ZeroSearch。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。