首页 > 快讯 > DeepMind的”尖端技术”震撼登场！Gemini Robotics On-Device赋予机器人瞬间成为”全能能手”的本领

DeepMind的”尖端技术”震撼登场！Gemini Robotics On-Device赋予机器人瞬间成为”全能能手”的本领

发布时间：2025-06-25 12:37:59 | 责任编辑：张毅 | 浏览量：343 次

Google DeepMind重磅推出新一代机器人AI模型——Gemini Robotics On-Device，引发行业热议。这款模型以其完全本地化运行、强大的任务适应能力和低样本学习特性，展现了机器人AI技术的全新突破。小编整理最新网络信息，为您深度解析这款模型的创新点及其对机器人产业的潜在影响。
完全本地化运行:摆脱云端束缚
Gemini Robotics On-Device的最大亮点在于其完全在机器人本地硬件上运行，无需依赖云端计算资源。这一特性解决了传统云端机器人面临的延迟和连接不稳定问题，尤其适用于网络环境受限的场景，如工厂、仓库或偏远地区。据介绍，该模型在本地运行时仍能接近云端Gemini模型的性能，展现出强大的计算效率和可靠性。
多任务能力:从拉拉链到叠衣服
这款模型集成了视觉、语言和动作控制，具备出色的多模态能力。它能通过自然语言指令理解人类意图，并转化为精准的机器人动作。演示中，机器人成功完成了拉拉链、倒液体、叠衣服等复杂任务，甚至在未“见过”的场景中表现出色，例如在工业流水线上进行组装。Google DeepMind表示，该模型在双臂机器人（如Franka FR3和Apollo人形机器人）上的表现尤为突出，展现了通用灵巧性和任务泛化能力。
低样本学习:50-100次示范即可上手
Gemini Robotics On-Device的另一大创新是其低样本学习能力。开发者只需通过50至100次任务示范，即可让机器人快速适应新任务。这种高效的微调方式得益于模型基于Gemini2.0的架构，结合了强大的视觉感知、语义理解和行为生成能力。Google DeepMind还发布了Gemini Robotics SDK，允许开发者在MuJoCo物理模拟器中测试模型，并通过“可信测试者”计划获取开发权限，极大降低了机器人AI的部署门槛。
行业前景:重新定义机器人应用
Gemini Robotics On-Device的发布标志着机器人AI迈向“可用、可部署、可泛化”的新阶段。其本地化运行和低样本学习的特性，不仅降低了企业的部署成本，还推动了机器人技术在制造业、物流、安保等领域的广泛应用。然而，模型在复杂环境下的泛化能力和安全性仍需进一步验证。小编认为，随着Google DeepMind持续优化，这一技术有望重塑机器人行业的未来格局。
Google DeepMind的Gemini Robotics On-Device以其本地化运行、多任务能力和低样本学习特性，展现了机器人AI技术的突破性进展。从拉拉链到工业组装，这款模型为机器人赋予了前所未有的灵活性和智能性。未来，随着SDK的开放和技术的迭代，机器人或将成为各行业不可或缺的“全能助手”。

DeepMind的“黑科技”Gemini Robotics On-Device确实令人瞩目，它让机器人在多个方面展现出“全能选手”的特质：

强大的多模态理解与执行能力

视觉-语言-行动融合：Gemini Robotics On-Device继承了Gemini 2.0的多模态推理能力，能够处理视觉信息、理解语言指令并生成物理动作指令。这意味着机器人可以像人类一样，通过视觉观察环境，理解自然语言的指示，然后做出相应的动作，例如根据指令拉开袋子拉链或折叠衣服。
复杂任务执行：该模型能够完成需要高度灵巧性和多步骤配合的任务，如折纸、打包饭盒、安装皮带等。这些任务不仅要求机器人有精细的动作控制能力，还需要其具备一定的空间推理和规划能力。

出色的泛化能力

适应新任务与环境：Gemini Robotics On-Device展现出强大的泛化性能，能够快速适应未经专门训练的新任务。仅需50到100个演示，它就能将基础知识泛化到新任务，例如在学会将葡萄放进餐盒后，可自行完成将笔放进笔盒的任务。
跨具身泛化：该模型还能适应不同类型的机器人，如从ALOHA机器人调整到双臂Franka FR3机器人和Apptronik的Apollo人形机器人。这表明同一个通用模型可以操控不同形态的机器人，执行各种任务。

本地运行与低延迟优势

无需网络连接：Gemini Robotics On-Device是首个可以直接部署在机器人上的VLA模型，无需持续的互联网连接。这对于延迟敏感型应用非常有用，确保机器人在连接中断或无网络的环境中也能稳定运行。
低延迟推理：经过优化，该模型可在机器人机体上高效运行，实现低延迟推理。这使得机器人能够更快速地响应指令和环境变化，提高操作的实时性和准确性。

开发者友好性

可微调与快速适应：作为DeepMind推出的首个可供微调的VLA模型，开发者可以对其进行调整以获得更佳性能。这为机器人的定制化和优化提供了极大的便利，使其能够更好地适应特定的应用场景和任务需求。
配套工具支持：谷歌还将发布Gemini Robotics SDK，帮助开发者轻松评估该模型在其任务和环境中的表现，并在DeepMind的MuJoCo物理模拟器中进行测试。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。