首页 > 快讯 > 谷歌DeepMind全新揭幕：离线AI机器人，实现如系鞋带等精准自主任务

谷歌DeepMind全新揭幕：离线AI机器人，实现如系鞋带等精准自主任务

发布时间：2025-06-25 10:35:11 | 责任编辑：张毅 | 浏览量：246 次

谷歌DeepMind近日发布博客文章，正式推出全新的Gemini Robotics On-Device本地化机器人AI模型。该模型采用视觉-语言-动作（VLA）架构，能够在无需云端支持的情况下实现实体机器人的精准控制。
新模型的最大亮点在于完全独立运行于机器人设备本地，实现了低延迟响应能力。这一特性使其特别适用于网络连接不稳定的环境，如医疗场所等关键应用场景。
在操作精度方面，该模型展现出令人印象深刻的能力，能够完成打开包袋拉链、叠衣服、系鞋带等高难度精细操作任务。系统采用双机械臂设计，目前已适配ALOHA、Franka FR3及Apollo人形机器人平台。
谷歌为开发者提供了完整的Gemini Robotics SDK工具包，大幅降低了定制门槛。开发者仅需通过50-100次任务演示即可为机器人定制全新功能，同时系统还支持MuJoCo物理模拟器进行预先测试。
在安全性方面，该系统建立了完善的保障机制。通过Live API实施语义安全检测，确保机器人行为的合规性，而底层安全控制器则负责精确管理动作的力度与速度，防止意外伤害。
项目负责人Carolina Parada表示:"该系统充分借鉴了Gemini的多模态世界理解能力，就如同Gemini能够生成文本、代码和图像一样，现在它也能生成精准的机器人动作。"
目前，该模型仅面向可信测试计划的开发者开放。值得注意的是，该模型基于Gemini2.0架构开发，相比谷歌最新的Gemini2.5版本存在一定技术代差。

谷歌DeepMind于2025年6月24日发布了名为Gemini Robotics On-Device的本地化机器人AI模型。该模型具有以下特点：

技术能力

离线运行：无需联网，可在机器人本地运行，适合网络不稳定或无网络的环境。
高精度操作：能完成系鞋带、叠衣服、打开包袋拉链等精细操作。
适配多种机器人：支持双机械臂设计，适配ALOHA、Franka FR3及Apollo人形机器人。

开发适配

SDK工具包：提供Gemini Robotics SDK，方便开发者评估模型表现并定制新功能。
低演示样本需求：开发者仅需50到100个任务演示样本，即可让模型适应新任务。
物理模拟器支持：支持MuJoCo物理模拟器测试，降低开发成本和风险。

安全保障

语义安全检测：通过Live API实施语义安全检测。
动作管理：底层安全控制器管理动作力度与速度。
开放测试框架：开放语义安全基准测试框架。

性能表现

泛化能力强：在视觉泛化、语义理解和行为泛化等多个维度上，表现超越之前最好的本地模型。
适应复杂任务：在处理分布外任务和复杂多步骤指令时，展现出碾压级的优势。

未来展望

跨平台部署：该模型不仅在ALOHA机器人上表现出色，还成功迁移到了其他不同类型的机器人平台上，展现出强大的泛化能力。
持续优化：虽然目前基于Gemini 2.0架构开发，但未来有望进一步升级。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。