仅需1美元即可执行200项浏览器操作任务!全新开源浏览器管理工具BU-30B-A3B-Preview震撼登场!
发布时间:2025-12-26 11:23:49 | 责任编辑:张毅 | 浏览量:1 次
近日,知名开源浏览器自动化项目BrowserUse正式发布了其首个自研大语言模型——BU-30B-A3B-Preview。该模型一经上线便引发广泛关注,被誉为“网页代理(Web Agent)领域的全新标杆”,以极致的成本效益和实时速度,彻底颠覆了AI浏览器操作的门槛。
模型架构:MoE设计,实现“大脑强大、身材轻盈”
BU-30B-A3B-Preview采用混合专家(MoE)架构,总参数规模达30B(300亿),但实际推理时仅激活3B(30亿)参数。这使得模型在保持顶级智能水平的同时,资源消耗大幅降低,仅需单张消费级GPU即可流畅运行。
该模型基于阿里云通义千问Qwen3-VL-30B-A3B-Instruct进行深度微调,专为浏览器自动化场景优化,支持多模态输入(视觉+文本),上下文长度高达32K tokens,能够轻松处理复杂长网页内容。
核心能力:卓越的DOM理解与视觉推理
BU-30B-A3B-Preview在浏览器操作任务中表现出色,具备全面的网页交互功能,包括精准元素定位、点击、滚动、表单填写等。其突出的DOM(文档对象模型)理解能力和视觉推理能力,让AI代理能像人类一样“看懂”页面布局和截图,实现高度可靠的自动化执行。
官方强调,该模型特别适合构建Web Agent应用场景,如自动化测试、数据采集、RPA流程等,已在内部基准测试中达到业内领先水平。
性能亮点:速度与成本双重碾压
官方发布的对比数据显示,BU-30B-A3B-Preview在任务完成速度和经济性上远超主流商用模型:
- 平均每步操作仅需1.2秒,整体任务完成时间大幅领先。
- 成本效益惊人:每1美元计算资源可可靠完成约200个浏览器任务,是部分竞品模型的数十倍。
由于模型体积相对较小(单GPU部署友好),开发者可轻松本地下载测试,无需高额云端费用。
开源意义:加速Web Agent生态发展
BU-30B-A3B-Preview已完全开源,模型权重上传至Hugging Face平台,任何开发者均可免费获取并集成到BrowserUse开源库中。这标志着浏览器自动化领域进入“高效开源时代”,有望推动更多创新应用落地。
小编点评 BU-30B-A3B-Preview的出现,完美解决了传统大模型在浏览器任务中“贵而慢”的痛点。对于需要大规模网页自动化的企业和开发者而言,这无疑是一款性价比极高的选择。未来,随着社区进一步优化,该模型有望成为Web Agent领域的标准配置。感兴趣的读者可立即前往Hugging Face下载体验。
地址:https://huggingface.co/browser-use/bu-30b-a3b-preview
这是一篇关于1美元跑200个浏览器任务!开源浏览器操控神器BU-30B-A3B-Preview横空出世的文章,内容值得关注。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
