首页 > 快讯 > ZeroSearch 由阿里通义实验室发布:使大模型能够自主“搜索”而无需 API

ZeroSearch 由阿里通义实验室发布:使大模型能够自主“搜索”而无需 API

发布时间:2025-05-19 12:08:44 | 责任编辑:张毅 | 浏览量:59 次

在人工智能的迅速发展中,如何提升大语言模型(LLM)的检索和推理能力成为研究的热门话题。近日,阿里通义实验室提出了一个名为 “ZeroSearch” 的新框架,它能够使大型语言模型自己模拟搜索引擎,从而在没有实际搜索引擎的情况下,提升其推理能力。
传统的搜索引擎虽然强大,但在训练大模型时,它们的输出质量常常不可预测,可能导致训练过程中的噪声和不稳定。此外,依赖真实搜索引擎的 API 调用会产生巨大的成本,这让大规模的强化学习训练变得不切实际。而 ZeroSearch 的出现,恰好解决了这些问题。这个框架通过模拟搜索环境和渐进式抗噪训练,允许大模型在无需与真实搜索引擎交互的情况下进行学习。
ZeroSearch 的核心是利用强化学习(RL)和少量的标注数据对大模型进行微调,使其能够生成有用的文档和干扰文档。在训练过程中,模型会学习如何生成与真实搜索引擎风格相似的内容,同时适应不同质量文档的生成。这种动态调整的能力让模型在面对更复杂的检索任务时,能够迅速适应并找到平衡。
此外,ZeroSearch 采用了课程式学习的方法。在训练初期,模型会接收到高质量的文档,而随着训练的深入,模型将逐步接触到混入噪声的文档。这种逐步提升难度的策略,不仅提升了模型的推理能力,还增强了训练的稳定性和效果。经过训练,模型能够在高质量和低质量文档中找到最佳的检索策略。
研究表明,ZeroSearch 在多个问答数据集上表现优异,尤其在单跳和多跳问答任务中,相较于传统方法,它的表现有明显优势。这意味着 ZeroSearch 不仅在简单问题上能提供准确答案,还能够应对更复杂的查询任务。
ZeroSearch 为大模型的自我学习提供了全新的思路,消除了与搜索引擎之间的依赖,使得大规模的强化学习训练更加经济可行。未来,ZeroSearch 有望在提升 LLM 的检索能力和应用范围方面发挥更大作用。

ZeroSearch 由阿里通义实验室发布:使大模型能够自主“搜索”而无需 API

阿里通义实验室推出的 ZeroSearch 是一种创新的大模型搜索引擎框架,它通过模拟搜索引擎的功能,让大模型无需依赖外部API即可实现自我“搜索”,从而提升检索和推理能力。

核心技术原理

  1. 轻量微调:ZeroSearch 使用少量标注数据对大语言模型(LLM)进行微调,使其能够生成两种文档:有用结果和噪声干扰。通过这种方式,模型能够模拟真实搜索引擎的风格,并根据提示词生成相关或噪声文档。

  2. 课程化抗噪训练:训练初期返回高质量文档,随后逐渐混入噪声(噪声比例按指数曲线上升)。这种课程式学习机制使模型从简单任务逐步过渡到复杂任务,最终能够在高质量和低质量文档中找到平衡。

  3. 强化学习闭环:ZeroSearch 完全消除了与真实搜索引擎交互的API费用,使得大规模强化学习训练更加经济可行。它兼容多种强化学习算法,如PPO(Proximal Policy Optimization)和GRPO(Group Relative Policy Optimization),为模型提供了不同的优化策略。

优势与特点

  • 无需API交互:通过模拟搜索引擎,ZeroSearch 避免了与真实搜索引擎的交互,从而大幅降低了训练成本。

  • 动态控制文档质量:模型能够根据提示词生成相关或噪声文档,为训练提供了多样化的检索场景。

  • 显著降低成本:相比传统方法,ZeroSearch 的训练成本大幅降低(超过80%),使得大规模训练更加可行。

  • 兼容性强:支持不同参数规模的大模型(如3B、7B、14B),并兼容多种强化学习算法。

实验结果

实验表明,ZeroSearch 在多个问答数据集上表现优异,尤其在单跳和多跳问答任务中,相较于传统方法,其表现有明显优势。GRPO 算法在训练稳定性方面表现更好,而PPO则在某些任务中提供了更高的灵活性。

应用前景

ZeroSearch 为大模型的自我学习提供了全新思路,消除了对搜索引擎的依赖,使得大规模强化学习训练更加经济可行。未来,它有望在提升LLM的检索能力和应用范围方面发挥更大作用。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复