meta 在人工智能领域再次掀起波澜,其全新自研大模型 Muse Spark 正式上线,标志着这家科技巨头在生成式 AI 赛道上迈出关键一步。此次发布由年仅 29 岁的前 Scale AI 联合创始人 Alexandr Wang 领衔,作为 meta 超级智能实验室(MSL)成立后的首个成果,Muse Spark 被定位为构建 "个人超级智能" 的核心引擎。
该模型的研发背景颇具戏剧性。2024 年 Llama 4 发布后因性能争议与数据争议陷入舆论漩涡,促使 meta 创始人扎克伯格启动大规模重组,成立 MSL 并高薪招募顶尖人才。Alexandr Wang 在社交平台透露,团队耗时九个月重构了整个 AI 技术栈,包括基础设施、模型架构与数据管线,最终打造出具备工具调用、视觉思维链与多智能体协同能力的 Muse Spark。
技术突破方面,Muse Spark 在多模态感知与推理任务中展现显著优势。其独创的 "深度思考" 模式通过调度多个智能体并行推理,在 Humanity’s Last Exam 测试中取得 58% 的成绩,FrontierScience Research 测试达 38%,性能对标 Gemini Deep Think 等前沿模型。更引人注目的是其算力效率——相比 Llama 4 Maverick,新模型在达到同等性能时所需训练计算量减少超过一个数量级。
应用场景设计凸显个性化特征。在健康管理领域,meta 与千名医生合作构建训练数据,使模型能够生成交互式健康报告,例如标注食物营养结构或运动涉及的肌肉群。技术演示中,用户上传饮食照片后,模型可自动标记推荐食物(绿点)与非推荐食物(红点),并显示健康评分与营养成分数据。在设备维护场景,模型能识别咖啡机组件并生成交互式使用教程,悬停操作步骤时高亮显示对应部件。
多智能体协同机制成为性能提升的关键。通过动态分配推理任务,系统在保持响应速度的同时提升问题解决能力。测试数据显示,相比单一智能体长时间思考,多智能体协作模式在复杂任务中表现更优,且推理 token 使用效率提升 30%。这种设计使 Muse Spark 在处理瑜伽动作纠正、数独游戏生成等交互任务时表现尤为突出。
目前 Muse Spark 已接入 meta AI 应用与网站,通过私有 API 向部分用户开放测试。尽管定价策略尚未公布,但技术文档显示其扩展能力遵循预训练、强化学习、测试时推理三大维度。值得关注的是,meta 未明确 Llama 系列后续开发计划,但强调 Muse Spark 将作为新模型家族的起点,这或许预示着公司战略重心向闭源模型转移。




















