全球大模型领域迎来新变局——小米近日正式推出其自主研发的万亿参数大模型MiMo-V2-Pro,并在全球最大模型聚合平台OpenRouter上以匿名形式完成"压力测试"。这款被内部称为"Agent时代执行中枢"的模型,凭借接近GPT-5.2的性能和仅为竞品六分之一的成本,迅速引发行业震动。
该模型最引人注目的突破在于其架构设计。通过稀疏激活技术,1万亿参数中仅需调动420亿即可完成复杂任务,配合进化后的7:1混合注意力机制,成功将上下文窗口扩展至100万token。这种设计使模型在处理长流程任务时,既能保持深度推理能力,又能将延迟控制在极低水平。小米AI实验室负责人罗福莉透露,团队早在数月前就锁定了这种架构方向,"当行业开始转向智能体应用时,我们已经完成了关键技术储备"。
在功能演示环节,MiMo-V2-Pro展现出惊人的执行能力。当被要求用Three.js开发3D塔防游戏时,模型直接生成了可运行的完整代码;面对复刻90年代杂志风格网页的复杂指令,其交付成果不仅包含精确的排版设计,还模拟了翻页动画和颗粒噪点效果。这种"从提示到成品"的交付模式,标志着大模型应用范式的重大转变。
第三方评测机构Artificial Analysis的数据印证了小米的技术实力。在智能体基准测试中,MiMo-V2-Pro的编码能力超越Claude 4.6 Sonnet,通用智能体性能接近Opus 4.6,工具调用准确率显著提升。更令人瞩目的是其成本优势——完成整套评测仅消耗7700万输出token,成本仅为GPT-5.2的1/7。这种"性能接近顶级,成本接近民用"的特性,被业界视为打破大模型应用门槛的关键突破。
小米的定价策略引发市场强烈反响。其输入/输出token价格分别定为1/3美元每百万(基础版)和2/6美元每百万(扩展版),缓存读取费用更是低至0.2-0.4美元每百万。这种激进的定价方式,配合即将推出的MiMo-V2-Omni和TTS系列模型,显示出小米抢占开发者市场的明确意图。雷军在微博特别强调:"今年AI领域研发投入将超160亿元,这只是一个开始。"
行业观察家指出,MiMo-V2-Pro的发布标志着大模型竞争进入新阶段。当其他厂商仍在比拼对话能力时,小米已经构建起从底层架构到应用落地的完整技术体系。罗福莉在技术分享中透露的细节更具启示意义:团队通过强制使用内部工具的方式,迫使研究人员快速理解智能体系统的潜力,"这种从使用到创造的转变,是我们能够快速迭代的关键"。
目前,小米尚未公布模型的具体开源计划,但罗福莉明确表示:"等模型足够稳定、真正配得上开源的时候,我们会开放核心代码。"这种谨慎而坚定的态度,反映出中国科技企业在全球AI竞赛中日益成熟的战略思维。随着MiMo-V2-Pro开始接受企业级用户测试,一场关于"大模型如何改变现实世界"的新竞赛已然拉开帷幕。






















