首页 > 快讯 > 阿里云推出开源网络智能平台 WebSailor,性能领先众多专有模型

阿里云推出开源网络智能平台 WebSailor,性能领先众多专有模型

发布时间:2025-07-08 10:43:11 | 责任编辑:吴昊 | 浏览量:57 次

阿里云今日宣布,其研发的网络智能体 WebSailor 已正式开源。WebSailor 的构建方案及部分数据集目前已在 GitHub 上线,标志着阿里云在推动 AI 领域开放创新方面迈出了重要一步。
据阿里云介绍,在英文版和中文版 BrowseComp 评测集的实测结果中,WebSailor-32B 和 WebSailor-72B 版本展现出卓越性能。它们不仅在开源模型和 Agent 阵营中实现了显著领先,甚至超越了包括 DeepSeek R1和 Grok-3在内的多款闭源模型,其表现仅次于闭源的 OpenAI DeepResearch。
WebSailor 的开源预计将加速网络智能体技术的发展,为开发者和研究人员提供强大的工具,以探索更高效、更智能的网页内容理解与交互方式。

阿里云推出开源网络智能平台 WebSailor,性能领先众多专有模型

阿里云开源的网络智能体 WebSailor 在近期的评测中表现卓越,超越了包括 DeepSeek R1、Grok-3 在内的一众闭源模型,仅次于 OpenAI 的 DeepResearch。

技术突破与创新

WebSailor 的成功主要得益于以下几项关键技术突破:

  1. SailorFog-QA 数据集:阿里云通义实验室大规模合成了具有高不确定性的复杂任务数据集 SailorFog-QA,通过这种高难度数据训练,让模型学会处理复杂的推理任务。

  2. DUPO 强化学习算法:该算法通过双阶段动态采样策略,大幅提升了训练效率,将复杂 Agent 的强化学习训练速度提升了约 2–3 倍。

  3. “专家轨迹 + 简洁重构”方法:让模型学会高效、紧凑的推理链,从而在复杂任务中表现出色。

评测表现

在 BrowseComp 中文版和英文版的评测中,WebSailor-32B 和 WebSailor-72B 的表现尤为突出:

  • 英文准确率达到 12.0%,中文准确率达到 30.1%,远超其他开源模型。

  • 小型模型 WebSailor-7B 的准确率也达到了 6.7%,超越了许多基于更大参数量的模型。

此外,WebSailor 在 SimpleQA 数据集上也表现出色,准确率达到 93.5%,展现出强大的泛化能力。

意义与展望

WebSailor 的开源为开源社区带来了新的希望,其“高难度任务合成 + 小规模冷启动 + 高效 RL 优化”的组合策略具有很强的普适性,未来有望在复杂推理问答、学术知识发现等领域发挥更大作用。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

热门AI推荐