近日,北京智源人工智能研究院震撼发布“悟界”系列大模型,标志着人工智能领域迈入了一个崭新的阶段。这一系列包含了多项全球首创的技术突破,其中尤为引人注目的是“悟界·Emu3”,作为全球首个原生多模态世界模型,它展现了前所未有的能力。
与此同时,研究院还推出了“悟界·见微 Brainμ”,这是全球首个基于脑科学的多模态通用基础模型。这两项技术的发布,不仅拓宽了人工智能的应用边界,更为脑科学与人工智能的融合探索提供了新的可能。
“悟界”系列大模型还涵盖了悟界·具身智能大模型的多个组成部分。其中,悟界·RoboOS 2.0作为全球首个支持MCP的跨本体大小脑协作框架,为机器人的智能化发展开辟了新路径。悟界·RoboBrain 2.0作为具身大脑大模型,以及全原子微观生命模型悟界·OpenComplex2的发布,进一步丰富了具身智能领域的研究成果。
回顾去年10月,智源研究院首次亮相的原生多模态世界模型Emu3,便以其独特的技术优势引起了广泛关注。该模型无需依赖复杂的扩散模型或组合方法,仅凭对下一个token的预测,便能实现对文本、图像、视频三种模态数据的全面理解和生成。Emu3的多模态输入与输出能力,验证了自回归框架在多模态领域的广泛适用性和先进性,为跨模态交互技术的发展奠定了坚实基础。
在Emu3的基础上,见微 Brainμ进一步拓展了多模态技术的应用范围。它基于Emu3的底层架构,将神经科学与脑医学相关的fMRI、EEG、双光子等脑信号进行统一token化处理。借助预训练模型的多模态对齐优势,见微 Brainμ能够实现多模态脑信号与文本、图像等模态之间的多向映射,从而完成跨任务、跨模态、跨个体的统一通用建模。这一技术突破,使得单一模型即可应对多种神经科学的下游任务,极大地提高了研究效率和准确性。
Emu3所生成的图像,不仅展示了其强大的生成能力,也预示着人工智能在艺术创作领域的无限潜力。随着“悟界”系列大模型的持续研发和应用,我们有理由相信,人工智能将在更多领域展现出其独特的价值和魅力。