在小米近期举办的“人车家全生态大会”上,一位新面孔引发了科技圈的广泛关注——小米MiMo大模型负责人罗福莉首次公开亮相。这位被贴上“AI天才少女”标签的年轻科学家,以近乎学术化的演讲风格,将技术思考与行业洞察娓娓道来,迅速成为舆论焦点。
1995年出生于四川宜宾的罗福莉,学术履历堪称亮眼:北京师范大学计算机本科毕业后,她进入北京大学计算语言学研究所深造,2019年凭借在国际顶级会议ACL发表的8篇论文崭露头角。此后,她先后在阿里达摩院和DeepSeek担任核心研发角色,直至今年11月通过朋友圈官宣加盟小米。据知情人士透露,雷军为招揽这位技术新星,曾开出千万级年薪,相关话题一度登上热搜榜。
在演讲中,罗福莉提出了对智能体发展的核心判断:当代AI必须突破单纯的语言交互,构建以代码能力和工具调用为核心的“高效沟通语言”。她指出,当前智能体间的交互带宽严重不足,唯有通过重构模型架构提升推理效率,才能实现从“回答问题”到“完成任务”的跨越。这一观点与小米正在推进的大模型战略形成强烈呼应——今年以来,小米以月为单位密集发布新模型:4月推出推理模型MiMo,5月上线多模态MiMo-VL,9月端到端语音模型MiMo-Audio问世,11月更是针对家庭场景推出Miloco系统。
数据印证着小米的生态野心:截至第三季度,其AIoT平台全球连接设备突破10.4亿台。罗福莉的加入,被视为小米破解“人车家”生态中模型理解世界难题的关键一步。她带领团队在入职不足10天时便公开首篇论文,提出跨具身基座模型MiMo-Embodied,尝试打通自动驾驶与具身智能两大领域。这一研究方向与她此前在朋友圈的宣言一脉相承:“智能终将从语言迈向物理世界,我们正在构建这样的未来。”
物理AI的概念正在成为行业新风向。按照英伟达的定义,这类模型通过运动技能理解现实世界,常见于机器人和自动驾驶汽车等自主系统。罗福莉将其简化为更直观的表述:“真正的智能要在交互中‘活出来’。”这种理念直接指向小米的核心生态:在“人车家”体系中,AI需要嵌入具体业务场景,承担感知、决策与执行的三重角色。12月16日公布的MiMo-V2-Flash开源模型(总参数量309B,活跃参数量15B),正是这一思路的实践成果——该模型已初步具备模拟世界的能力,实现了低成本与高速度的平衡。
小米的生态布局正显现出系统性特征。据集团总裁卢伟冰披露,MiMo系列已形成覆盖推理、视觉、多模态、音频与具身的多层级架构。其中,11月推出的Xiaomi Miloco智能家居方案尤为引人注目:通过端侧视觉语言大模型MiMo-VL-Miloco-7B,系统可结合摄像头实时数据,将传统“单一条件触发”升级为“多维度场景感知”。用户只需口语化表达需求,系统便能自动创建智能规则,无需手动设置复杂触发条件。
行业观察家指出,Miloco的核心突破在于打破设备孤岛。资深互联网分析师丁道师认为:“未来连桌椅板凳都可能融入智能家居系统,本地大模型能自动感知需求、切换场景,同时保护用户隐私。”这种“主动服务”模式,正在重塑人机交互范式。GKURC智库分析师丁少将则强调,Miloco展现的集中式操作系统趋势,可能催生类似AI手机的统一调度中枢,但关键在于能否建立跨品牌协议标准,“一旦突破生态壁垒,智能家居将从‘单点智能’跃升为自主决策的‘空间智能体’”。




















