阿里Qwen-Robot系列发布：三大模型赋能机器人，开启具身智能新征程-汽车-沃资讯

阿里Qwen-Robot系列发布：三大模型赋能机器人，开启具身智能新征程

发布时间：2026-06-17 07:37 来源：快讯作者：江紫萱

阿里巴巴在具身智能领域迈出关键一步，正式推出千问大模型家族首个完整体系——Qwen-Robot系列。该系列包含操作、移动与世界三大模型，通过协同运转为机器人赋予“边走、边看、边思考”的跨场景能力，成为连接数字智能与物理世界的通用技术底座。

在具身智能商业化临界点上，Qwen-Robot系列展现出突破性技术实力。其操作模型Qwen-RobotManip在RoboChallenge Table30 v1全球评测中包揽前两名，成功完成拧水龙头、双臂倒薯条等30项复杂任务。该模型采用80维统一动作表征体系，将机械臂、移动底盘等不同硬件的操作逻辑转化为通用“肢体语言”，使模型能迁移至新硬件时仅需少量交互即可快速适配，彻底摆脱对特定动作序列的机械记忆依赖。

针对传统模型对绝对坐标的过度依赖，研发团队创新性地引入相对位置决策机制。通过摄像头画面中的空间关系直接生成操作指令，模型在环境变化时响应速度提升40%，任务完成率提高28%。更引人注目的是，该模型完全基于开源数据训练，在38000小时语料预训练中构建起物理规律认知框架，为行业破解私有数据采集难题提供新路径。

移动导航领域，Qwen-RobotNav模型通过任务自适应观察机制实现智能记忆管理。当宇树Go2四足机器人执行“寻找丢失行李箱”指令时，模型能根据任务类型动态调整记忆容量——在开放空间采用广角视觉搜索，在狭窄通道切换为局部路径优化。这种弹性记忆策略使导航成功率提升至92%，较传统模型提高35个百分点。其通用接口设计更支持与多种智能体框架无缝对接，成为业内首个原生兼容多平台的VLN模型。

作为具身智能的“预演引擎”，Qwen-RobotWorld模型构建起物理规律驱动的虚拟仿真环境。该模型可生成逼真的动作-状态视频数据，为训练提供海量合成样本，有效缓解行业数据短缺困境。在真实任务执行前，模型能提前推演机械臂运动轨迹，将操作精度误差控制在0.1毫米以内，特别适用于精密装配、医疗辅助等高要求场景。

三大模型通过统一语言指令实现深度协同：当机器人接收“整理杂乱桌面”指令时，Qwen-RobotNav规划最优移动路径，Qwen-RobotManip执行物品抓取与摆放，Qwen-RobotWorld则持续模拟动作可行性并动态调整策略。这种有机配合使机器人能像人类一样理解任务目标、分解操作步骤，并在复杂环境中自主决策。

行业观察指出，Qwen-Robot系列的推出标志着国内大模型技术向硬件场景的延伸进入加速期。其突破性架构设计不仅降低机器人开发门槛，更通过开源数据训练模式推动行业生态开放，为具身智能从实验室走向千行百业奠定技术基石。

更多>同类内容