首页 > 快讯 > 谷歌DeepMind全新揭幕:离线AI机器人,实现如系鞋带等精准自主任务

谷歌DeepMind全新揭幕:离线AI机器人,实现如系鞋带等精准自主任务

发布时间:2025-06-25 10:35:11 | 责任编辑:张毅 | 浏览量:5 次

谷歌DeepMind近日发布博客文章,正式推出全新的Gemini Robotics On-Device本地化机器人AI模型。该模型采用视觉-语言-动作(VLA)架构,能够在无需云端支持的情况下实现实体机器人的精准控制。
新模型的最大亮点在于完全独立运行于机器人设备本地,实现了低延迟响应能力。这一特性使其特别适用于网络连接不稳定的环境,如医疗场所等关键应用场景。
在操作精度方面,该模型展现出令人印象深刻的能力,能够完成打开包袋拉链、叠衣服、系鞋带等高难度精细操作任务。系统采用双机械臂设计,目前已适配ALOHA、Franka FR3及Apollo人形机器人平台。
谷歌为开发者提供了完整的Gemini Robotics SDK工具包,大幅降低了定制门槛。开发者仅需通过50-100次任务演示即可为机器人定制全新功能,同时系统还支持MuJoCo物理模拟器进行预先测试。
在安全性方面,该系统建立了完善的保障机制。通过Live API实施语义安全检测,确保机器人行为的合规性,而底层安全控制器则负责精确管理动作的力度与速度,防止意外伤害。
项目负责人Carolina Parada表示:"该系统充分借鉴了Gemini的多模态世界理解能力,就如同Gemini能够生成文本、代码和图像一样,现在它也能生成精准的机器人动作。"
目前,该模型仅面向可信测试计划的开发者开放。值得注意的是,该模型基于Gemini2.0架构开发,相比谷歌最新的Gemini2.5版本存在一定技术代差。

谷歌DeepMind全新揭幕:离线AI机器人,实现如系鞋带等精准自主任务

谷歌DeepMind于2025年6月24日发布了名为Gemini Robotics On-Device的本地化机器人AI模型。该模型具有以下特点:

技术能力

  • 离线运行:无需联网,可在机器人本地运行,适合网络不稳定或无网络的环境。

  • 高精度操作:能完成系鞋带、叠衣服、打开包袋拉链等精细操作。

  • 适配多种机器人:支持双机械臂设计,适配ALOHA、Franka FR3及Apollo人形机器人。

开发适配

  • SDK工具包:提供Gemini Robotics SDK,方便开发者评估模型表现并定制新功能。

  • 低演示样本需求:开发者仅需50到100个任务演示样本,即可让模型适应新任务。

  • 物理模拟器支持:支持MuJoCo物理模拟器测试,降低开发成本和风险。

安全保障

  • 语义安全检测:通过Live API实施语义安全检测。

  • 动作管理:底层安全控制器管理动作力度与速度。

  • 开放测试框架:开放语义安全基准测试框架。

性能表现

  • 泛化能力强:在视觉泛化、语义理解和行为泛化等多个维度上,表现超越之前最好的本地模型。

  • 适应复杂任务:在处理分布外任务和复杂多步骤指令时,展现出碾压级的优势。

未来展望

  • 跨平台部署:该模型不仅在ALOHA机器人上表现出色,还成功迁移到了其他不同类型的机器人平台上,展现出强大的泛化能力。

  • 持续优化:虽然目前基于Gemini 2.0架构开发,但未来有望进一步升级。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复