对话王晓刚:AI3.0时代,如何以“人”为中心突破具身智能瓶颈?

   发布时间:2025-12-19 17:52 作者:唐云泽

在人工智能领域,一场从数字世界向物理世界的跃迁正在悄然发生。十一年前,王晓刚与汤晓鸥共同推动计算机视觉识别率首次超越人类肉眼,开启了人工智能1.0时代。如今,当行业沉浸在大语言模型的狂欢中时,王晓刚却将目光投向了更具挑战性的领域——具身智能。他直言:“现有研究范式已陷入瓶颈,唯有以人类行为为核心重构物理规律,才能叩开AI 3.0的大门。”

2025年被视为具身智能发展的关键节点。王晓刚指出,当前大语言模型依赖的互联网语料正面临枯竭危机,纯粹的数字世界探索已触及天花板。具身智能通过与物理世界的交互产生新智能,成为突破这一困境的核心路径。然而,现实中的机器人仍难以走出实验室:在复杂环境中,它们因缺乏常识而屡屡受挫,演示中的“高光时刻”难以转化为实际场景中的稳定表现。

面对这一困境,王晓刚提出“以人为中心”的新研究范式。他回忆道,2025年初,团队在南洋理工大学刘子纬教授带领下,开创了“环境式采集”技术。通过第一视角摄像头、穿戴式传感器及全景相机,记录人类在真实生产生活中的行为数据。这种模式不仅将数据量级从十万小时提升至千万小时,更解决了数据采集效率低、场景单一的问题。例如,在杭州某前置仓试点中,工作人员佩戴设备工作10小时即可采集同等时长数据,且覆盖上万种商品,效率较传统遥操作提升百倍。

在商业化落地层面,大晓机器人选择了软硬协同的垂直整合路径。其推出的“具身超级大脑模组A1”已应用于四足机器人,实现户外自主导航与语音任务执行。通过与商汤方舟平台打通,机器人可直接调用150余种AI应用,价值链条得以延伸。王晓刚透露,未来三年将聚焦三大场景:短期以电力巡检、文旅等户外场景为主,中期攻克前置仓分拣难题,长期目标则是家庭服务机器人。

值得关注的是,大晓机器人选择在此时开源“开悟3.0”模型及工具链,并完成与沐曦、海光等国产芯片的深度适配。王晓刚解释,开源不仅能快速建立生态优势,更可通过云服务部署实现商业闭环。他以DeepSeek为例,强调先发优势的重要性:“当高质量开源项目形成聚集效应,芯片厂商会主动适配,生态壁垒自然形成。”

谈及公司命名,王晓刚笑称“大晓”源于他与首席科学家陶大程的师兄弟情谊,但更深层的含义藏在发布会主题中——“大千世界,晓识万象”。这八个字,既是对世界模型理解物理世界的期许,也是对环境式采集感知交互规律的诠释。在这场从数字到物理的跃迁中,王晓刚正带领团队书写新的规则。

 
 
更多>同类内容
全站最新
热门内容