谷歌发布新一代Gemini机器人AI模型，实现本地高效运行-科技-沃资讯

谷歌发布新一代Gemini机器人AI模型，实现本地高效运行

发布时间：2025-06-25 19:41 来源：ITBEAR 作者：王婷

谷歌在机器人技术领域再度迈出重要一步，近日推出了Gemini Robotics On-Device模型，这是其“视觉语言动作”（VLA）模型的升级版。据谷歌官方介绍，这款新模型代表了他们目前最强大的VLA技术能力，特别之处在于它经过优化，可以在机器人设备上直接本地运行。

DeepMind的高级总监及机器人项目负责人分享道，这款模型的独特优势在于其不依赖于数据网络，因此对延迟敏感的应用场景极为友好。即使在间歇性断网或无网络连接的环境下，它也能保持稳定运行，这为机器人的广泛应用提供了更多可能性。

Gemini Robotics On-Device模型是在今年3月推出的Gemini Robotics基础上升级而来，专为双臂机器人设计。谷歌明确表示，这款模型旨在提升机器人在应对复杂任务时的灵巧性和适应能力。在一次演示活动中，团队展示了搭载这一本地模型的机器人，它们能够轻松完成如拉开拉链、折叠衣物等精细动作。

值得注意的是，虽然该模型最初是为ALOHA机器人训练的，但谷歌随后对其进行了调整，使其也适用于双臂Franka FR3机器人和Apollo人形机器人。这一灵活性显示了谷歌在机器人技术领域的广泛布局和深厚实力。

为了推动Gemini Robotics的进一步发展，谷歌DeepMind还发布了配套的Gemini Robotics SDK。开发人员可以在MuJoCo高级物理模拟器上利用这些模型，通过向机器人展示50到100个任务演示来训练它们完成任务。这一举措无疑将加速机器人技术的研发和应用进程。

与单纯的大语言模型相比，机器人AI面临更多挑战。机器人不仅存在于物理世界中，还会改变其环境。谷歌DeepMind机器人技术负责人强调，Gemini不仅能够生成文本、写诗、总结文章甚至编写代码，现在还能生成机器人动作。这意味着谷歌的机器人模型已经能够通过大数据训练各种动作，在快速迭代中应对物理世界的各种问题。

在安全性方面，谷歌也采取了严格措施。他们采用多层限制的方法，通过底层VLA模型和上层VLA推理模型共同管理机器人的指令。这种“AI管理AI”的方式旨在确保机器人的安全运行，避免潜在的风险。

随着谷歌在机器人技术领域的不断突破，越来越多的公司也开始关注这一领域。Nvidia等知名企业正在秘密研发自己的机器人项目，国内也有众多企业在默默耕耘。可以预见，一场新的AI大战即将拉开帷幕，让我们共同期待这一领域的精彩发展。

更多>同类内容