蚂蚁集团旗下灵波科技近日宣布,其自主研发的世界模型LingBot-World正式面向全球开发者开源。这是继空间感知模型LingBot-Depth和具身大模型LingBot-VLA之后,灵波科技在具身智能领域推出的第三款核心开源模型,标志着蚂蚁集团在通用人工智能(AGI)战略中完成了从虚拟数字空间到物理感知能力的关键跨越。
据技术团队介绍,LingBot-World在视频生成质量、动态场景还原度、长时序稳定性等核心指标上已达到国际领先水平,可与谷歌最新发布的Genie 3模型相媲美。该模型通过构建高保真、强交互的数字仿真环境,为具身智能训练、自动驾驶算法验证以及游戏开发等领域提供了突破性解决方案。特别是在处理复杂动态场景时,其生成的虚拟环境能够实时响应物理规则变化,支持多智能体协同交互。
针对视频生成领域长期存在的"长时漂移"难题,灵波科技研发团队创新性地采用多阶段训练架构与并行计算优化技术。通过动态记忆机制和时空一致性约束算法,LingBot-World成功将连续无损生成时长提升至近10分钟,较传统模型提升300%以上。这一突破使得机器人操作训练、自动驾驶决策系统开发等需要长序列交互的场景获得更可靠的仿真环境支持。
开源社区已同步开放LingBot-World的完整模型权重与推理代码库,开发者可基于PyTorch框架快速部署。该模型支持多模态输入接口,能够兼容视觉、语言、传感器等多种数据类型,为跨领域应用开发提供灵活基础。灵波科技表示,后续将持续优化模型在极端场景下的适应能力,并计划推出行业定制化版本。
业内专家指出,蚂蚁集团通过"基础模型-通用应用-实体交互"的三层技术架构,正在构建完整的AGI技术生态。此次开源的世界模型不仅填补了国内在高端数字仿真领域的空白,其开放的研发模式更将加速具身智能技术的产业化进程,为智能制造、智慧城市等战略性新兴产业提供关键技术支撑。




















