英伟达在近期举办的GTC 2026大会上,正式发布全球首个专为医疗机器人设计的物理AI平台,涵盖数据集、开放模型、多模态架构及开发工具四大核心组件。这一突破性成果旨在加速医疗机器人从实验室到临床场景的落地应用,为手术机器人、康复设备等细分领域提供标准化技术底座。
作为平台核心的Open-H医疗机器人数据集,收录了776小时真实手术视频,覆盖11种主流机器人系统及4类高发手术场景。该数据集通过结构化标注技术,将器械运动轨迹、组织形变等关键参数与视频帧同步,为模型训练提供可量化的物理世界反馈。开发者可基于这些数据构建具备环境感知能力的决策系统,显著提升手术机器人的自主操作精度。
平台同步推出Cosmos-H模型家族与GR00T-H多模态架构。前者支持通过自然语言提示、医学影像或实时视频流,对机器人决策路径进行动态评估;后者则构建了临床文本指令与机械臂运动指令的映射关系,可将"缝合0.5厘米伤口"等描述转化为精确的动作令牌序列。两项技术结合,使医疗机器人具备理解复杂临床需求并生成可执行方案的能力。
针对医院环境模拟需求,Rheo开发工具包提供高精度物理引擎,可复现手术室设备布局、人体组织力学特性等关键要素。开发者通过调整参数即可生成不同手术场景的虚拟环境,用于验证机器人算法的鲁棒性。该工具已集成到主流机器人开发框架中,大幅缩短了从算法设计到临床测试的周期。
目前Open-H数据集、Cosmos-H模型及GR00T-H架构已在GitHub和Hugging Face平台开放下载,配套的Rheo工具包提供Python/C++双接口。医疗设备厂商与科研机构可基于这些资源,快速开发针对特定手术类型的定制化解决方案,推动智能医疗设备向更安全、更高效的方向演进。




















