蚂蚁灵波科技开源LingBot-Depth模型 攻克透明反光物空间感知难题

   发布时间:2026-01-27 13:16 作者:顾雨柔

蚂蚁集团旗下具身智能企业灵波科技近日宣布,其自主研发的高精度空间感知模型LingBot-Depth正式开源。该模型通过融合奥比中光Gemini 330系列双目3D相机的原始数据,显著提升了机器人、自动驾驶等智能终端在复杂环境中的三维视觉能力,为行业突破空间感知瓶颈提供了新方案。

在权威基准测试中,LingBot-Depth展现出领先优势。对比PromptDA与PriorDA等主流模型,其在NYUv2室内场景评测中的相对误差(REL)降低超70%,ETH3D稀疏SfM任务中的RMSE误差减少约47%。这一突破源于模型对环境深度信息的精准解析能力,尤其在处理透明、反光物体时表现突出。

传统深度相机在面对玻璃、镜面等材质时,常因光学特性导致数据丢失或噪声干扰。灵波科技研发的“掩码深度建模”(MDM)技术,通过整合RGB图像的纹理、轮廓及环境上下文信息,实现了对缺失深度数据的智能补全。实验数据显示,搭载该技术的Gemini 330系列相机,在强逆光、复杂曲面等极端场景下,输出的深度图仍保持边缘锐利、结构完整,性能优于Stereolabs ZED Stereo Depth等国际标杆产品。

模型训练依托于灵波科技构建的核心数据集,包含200万组真实场景深度配对数据及100万组仿真数据,覆盖近千万份原始样本。这一数据资产将于近期开源,旨在降低行业研发门槛,加速复杂场景空间感知技术的普及。奥比中光已宣布,将基于LingBot-Depth推出新一代深度相机,进一步强化硬件与算法的协同效应。

此次开源标志着蚂蚁灵波科技在具身智能领域的技术沉淀进入新阶段。据内部人士透露,除空间感知模型外,该公司本周还将陆续开源多款具身智能方向的核心模型,持续推动行业生态建设。

 
 
更多>同类内容
全站最新
热门内容