智源研究院重磅发布：悟界系列大模型，原生多模态与脑科学新突破！-科技-沃资讯

智源研究院重磅发布：悟界系列大模型，原生多模态与脑科学新突破！

发布时间：2025-06-06 11:45 来源：ITBEAR 作者：江紫萱

近日，北京智源人工智能研究院震撼发布“悟界”系列大模型，标志着人工智能领域迈入了一个崭新的阶段。这一系列包含了多项全球首创的技术突破，其中尤为引人注目的是“悟界·Emu3”，作为全球首个原生多模态世界模型，它展现了前所未有的能力。

与此同时，研究院还推出了“悟界·见微 Brainμ”，这是全球首个基于脑科学的多模态通用基础模型。这两项技术的发布，不仅拓宽了人工智能的应用边界，更为脑科学与人工智能的融合探索提供了新的可能。

“悟界”系列大模型还涵盖了悟界·具身智能大模型的多个组成部分。其中，悟界·RoboOS 2.0作为全球首个支持MCP的跨本体大小脑协作框架，为机器人的智能化发展开辟了新路径。悟界·RoboBrain 2.0作为具身大脑大模型，以及全原子微观生命模型悟界·OpenComplex2的发布，进一步丰富了具身智能领域的研究成果。

回顾去年10月，智源研究院首次亮相的原生多模态世界模型Emu3，便以其独特的技术优势引起了广泛关注。该模型无需依赖复杂的扩散模型或组合方法，仅凭对下一个token的预测，便能实现对文本、图像、视频三种模态数据的全面理解和生成。Emu3的多模态输入与输出能力，验证了自回归框架在多模态领域的广泛适用性和先进性，为跨模态交互技术的发展奠定了坚实基础。

在Emu3的基础上，见微 Brainμ进一步拓展了多模态技术的应用范围。它基于Emu3的底层架构，将神经科学与脑医学相关的fMRI、EEG、双光子等脑信号进行统一token化处理。借助预训练模型的多模态对齐优势，见微 Brainμ能够实现多模态脑信号与文本、图像等模态之间的多向映射，从而完成跨任务、跨模态、跨个体的统一通用建模。这一技术突破，使得单一模型即可应对多种神经科学的下游任务，极大地提高了研究效率和准确性。

Emu3所生成的图像，不仅展示了其强大的生成能力，也预示着人工智能在艺术创作领域的无限潜力。随着“悟界”系列大模型的持续研发和应用，我们有理由相信，人工智能将在更多领域展现出其独特的价值和魅力。

更多>同类内容