首页 > 快讯 > 阿里巴巴推出WebSailor AI Agent开源计划,旨在消除信息获取障碍

阿里巴巴推出WebSailor AI Agent开源计划,旨在消除信息获取障碍

发布时间:2025-07-28 10:26:38 | 责任编辑:吴昊 | 浏览量:7 次

随着互联网的迅猛发展,信息的爆炸式增长让人类在信息检索上面临诸多挑战。为了应对这些挑战,阿里巴巴的通义实验室推出了一款创新的开源 AI 智能体框架 ——WebSailor。该框架以其卓越的性能,尤其在复杂任务处理上,已在 GitHub 上获得了超过5000颗星的评价,成为每日增长率最高的项目之一。
WebSailor 的开发团队通过多项基准测试验证了其出色的性能。在 BrowseComp-en/zh 测试中,WebSailor 的表现超越了所有现有开源智能体,甚至与一些闭源模型相媲美。此外,在 SimpleQA 基准测试中,WebSailor 同样展示了其在简单任务处理上的优越性。
WebSailor 的核心技术主要集中在复杂任务生成和强化学习两个模块上。这两个模块相辅相成,使得 WebSailor 在处理复杂信息检索任务时展现出更高的效率。
复杂任务生成 :为了模拟真实世界的信息环境,研究团队构建了复杂的知识图谱。这些图谱通过随机游走的方式生成,体现了高度的非线性和复杂性。每个节点代表一个实体,边则显示实体之间的关系,形成多样化的组合,提供了生成高不确定性任务的基础。
强化学习模块 :强化学习的目标是通过与环境的交互优化模型的行为策略。WebSailor 采用了两阶段的训练方法,首先通过拒绝采样的微调阶段(RFT)来冷启动模型,然后进入强化学习阶段。在此过程中,研究团队还引入了动态采样策略优化训练过程,提出了 DUPO 算法,使模型在更少样本下实现更高的性能。
为了进一步增加任务的复杂性,研究团队在生成问答对时引入了信息模糊化技术。这种技术将精确的信息替换为模糊的描述,使得问题更具挑战性,要求模型进行更复杂的推理和信息合成。这一创新手段不仅提高了任务的难度,也提升了模型的智能水平。
随着 WebSailor 的发布,阿里巴巴在人工智能领域的创新又向前迈进了一步。开源的特性不仅有助于技术的普及和发展,也为开发者提供了更多的探索空间和实践机会。未来,WebSailor 有望在信息检索、智能问答等多个领域展现出更大的潜力。
开源地址:https://github.com/Alibaba-NLP/WebAgent

阿里巴巴推出WebSailor AI Agent开源计划,旨在消除信息获取障碍

阿里巴巴通义实验室开源的 WebSailor AI Agent 框架,直接对标 OpenAI 的 Deep Research 产品,通过复杂任务生成和强化学习模块的双重技术架构,显著提升了开源智能体在复杂信息检索任务上的性能,打破了闭源系统的垄断。

核心表现

  • 性能突破:WebSailor 在 BrowseComp-en/zh 测试中表现显著优于所有开源智能体,甚至可媲美专属闭源模型(如 DeepResearch);在 SimpleQA 基准测试中也超越了其他方法。

  • 技术创新:通过构建复杂知识图谱(非线性、随机游走生成)和动态采样策略,WebSailor 能在海量信息中高效检索和推理,解决了复杂网页信息检索任务中的“信息迷雾”问题。

  • 开源贡献:WebSailor 开源了部分 SailorFog-QA 数据和训练方法,为资源有限的团队提供了可复现的解决方案,缩小了开源与闭源系统的能力鸿沟。

行业意义

WebSailor 的开源不仅推动了开源智能体在复杂信息检索任务中的性能提升,还为开源社区提供了可借鉴的通用 workflow(高难度任务合成 + 小规模冷启动 + 高效 RL 优化),有望在未来攻克更多“超越人类能力”的任务。

GitHub 地址:https://github.com/Alibaba-NLP/WebAgent

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具