谷歌发布新一代Gemini机器人AI模型,实现本地高效运行

   发布时间:2025-06-25 19:41 作者:王婷

谷歌在机器人技术领域再度迈出重要一步,近日推出了Gemini Robotics On-Device模型,这是其“视觉语言动作”(VLA)模型的升级版。据谷歌官方介绍,这款新模型代表了他们目前最强大的VLA技术能力,特别之处在于它经过优化,可以在机器人设备上直接本地运行。

DeepMind的高级总监及机器人项目负责人分享道,这款模型的独特优势在于其不依赖于数据网络,因此对延迟敏感的应用场景极为友好。即使在间歇性断网或无网络连接的环境下,它也能保持稳定运行,这为机器人的广泛应用提供了更多可能性。

Gemini Robotics On-Device模型是在今年3月推出的Gemini Robotics基础上升级而来,专为双臂机器人设计。谷歌明确表示,这款模型旨在提升机器人在应对复杂任务时的灵巧性和适应能力。在一次演示活动中,团队展示了搭载这一本地模型的机器人,它们能够轻松完成如拉开拉链、折叠衣物等精细动作。

值得注意的是,虽然该模型最初是为ALOHA机器人训练的,但谷歌随后对其进行了调整,使其也适用于双臂Franka FR3机器人和Apollo人形机器人。这一灵活性显示了谷歌在机器人技术领域的广泛布局和深厚实力。

为了推动Gemini Robotics的进一步发展,谷歌DeepMind还发布了配套的Gemini Robotics SDK。开发人员可以在MuJoCo高级物理模拟器上利用这些模型,通过向机器人展示50到100个任务演示来训练它们完成任务。这一举措无疑将加速机器人技术的研发和应用进程。

与单纯的大语言模型相比,机器人AI面临更多挑战。机器人不仅存在于物理世界中,还会改变其环境。谷歌DeepMind机器人技术负责人强调,Gemini不仅能够生成文本、写诗、总结文章甚至编写代码,现在还能生成机器人动作。这意味着谷歌的机器人模型已经能够通过大数据训练各种动作,在快速迭代中应对物理世界的各种问题。

在安全性方面,谷歌也采取了严格措施。他们采用多层限制的方法,通过底层VLA模型和上层VLA推理模型共同管理机器人的指令。这种“AI管理AI”的方式旨在确保机器人的安全运行,避免潜在的风险。

随着谷歌在机器人技术领域的不断突破,越来越多的公司也开始关注这一领域。Nvidia等知名企业正在秘密研发自己的机器人项目,国内也有众多企业在默默耕耘。可以预见,一场新的AI大战即将拉开帷幕,让我们共同期待这一领域的精彩发展。

 
 
更多>同类内容
全站最新
热门内容
本栏最新