首页 > 快讯 > 智元机器人推出开源GO-1模型,助力具身智能技术的广泛传播

智元机器人推出开源GO-1模型,助力具身智能技术的广泛传播

发布时间:2025-09-23 16:37:24 | 责任编辑:张毅 | 浏览量:17 次

智元机器人宣布开源通用具身基座大模型 GO-1(Genie Operator-1),这也是全球首个采用 Vision-Language-Latent-Action (ViLLA) 架构的具身智能模型。此次开源旨在降低具身智能的技术门槛,让更多开发者能够参与这一前沿技术的应用与发展。该模型的发布紧随其后的是今年1月开源的 AgiBot World 具身智能百万真机数据集。
GO-1模型的核心是 ViLLA 架构,这一技术突破使得机器人能够更好地理解人类意图,执行更加精确的动作。与传统的 Vision-Language-Action (VLA) 架构相比,ViLLA 通过引入隐式动作标记,成功连接了图像、文本输入与机器人的实际动作。该架构的设计分为三层,首先是 VLM 多模态理解层,它基于 InternVL-2B 构建,具备处理视觉、力觉和语言等多种信息的能力。其次是 Latent Planner 隐式规划器,能够实现复杂任务的高层次理解。最后是 Action Expert 动作专家,通过扩散模型生成连续的高精度动作序列,以确保机器人可以执行复杂的操控任务。
此外,智元机器人还推出了 Genie Studio 开发平台,为开发者提供全方位的解决方案,包括数据采集、模型训练、仿真评测等。这一平台不仅集成了 GO-1模型,还提供了视频训练方案和统一训练框架,极大提升了开发效率,帮助具身智能技术的快速落地。
GO-1模型虽然基于 AgiBot G1机器人的数据进行预训练,但经过多种机器人平台的验证测试,显示出其良好的可移植性。这一模型已在多个主流仿真平台上取得了优异的性能表现,展现了其适应不同机器人的能力。
智元机器人鼓励广大开发者访问 GitHub 仓库下载 GO-1模型,开启具身智能的开发之旅。无论是资深 AI 研究者还是新手,GO-1都将为他们提供强大的技术支持。
GitHub:
https://github.com/OpenDriveLab/AgiBot-World
Huggingface:
https://huggingface.co/agibot-world/GO-1
划重点:
🌟 全球首个开源的 ViLLA 架构模型 GO-1正式推出。
🔧 Genie Studio 开发平台提供全流程解决方案,助力开发者。
🤖 GO-1模型经过多种平台测试,展现出良好的可移植性。

智元机器人推出开源GO-1模型,助力具身智能技术的广泛传播

这是一篇关于智元机器人发布开源 GO-1 模型,推动具身智能技术普及的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐