近日,AI领域迎来一项重要突破——Anuttacon技术团队发布了名为LPM 1.0的基于视频的角色表演模型。该模型由24位研究人员共同参与开发,能够实现实时说话、唱歌、倾听、反应及表情生成,为角色对话、虚拟直播、游戏NPC等场景提供了全新的技术解决方案。
据介绍,LPM 1.0是面向单人全双工音视频对话的表演大模型,针对现有视频生成模型在表现力、实时推理和长时身份稳定性等方面的不足进行了针对性优化。团队构建了以人为中心的多模态数据集,通过训练17B参数的Base LPM并蒸馏为低延迟流式的Online LPM,实现了无限时长下身份一致的实时视频生成与细腻拟人化表演。团队还打造了首个交互角色表演基准LPM-Bench,在各项评估中取得领先成果,为对话代理、直播角色和游戏NPC提供了通用视觉引擎。
从技术实现来看,LPM 1.0支持多模态输入,用户可通过1张图片、可选参考图片、音频及文本生成角色表演视频。模型采用全局外观参考、多视角身体图像与面部表情参考素材等多维度身份稳定要素,有效规避了牙齿、表情纹路等细节的错误生成问题。同时,该模型无需微调即可支持写实、2D动漫、3D游戏及非类人生物等不同角色风格,展现出强大的泛化能力。
在互动体验方面,LPM 1.0支持全双工实时对话,双方可同时说话、倾听并随时打断,模型会通过停顿、身体节奏和目光转移等细节增强真实感。非对话场景中,角色独处时也会展现自然的呼吸节奏和情感表达。与同类技术相比,LPM 1.0在视觉忠实度、口型精准度、身份保护及自然感等方面表现突出,且支持任意长度内容生成,突破了Kling-Avatar 2.0和OmniHuman 1.5等模型30秒的时长限制。
尽管技术优势显著,但Anuttacon团队目前并无公开模型权重、源代码或在线演示的计划。此次发布主要用于展示研究进展,供学术交流使用。不过,这一动作被解读为团队扩大AI人才招聘的信号。据悉,Anuttacon由米哈游创始人蔡浩宇创办,其技术探索方向与米哈游在AI领域的布局密切相关。例如,米哈游此前已在《崩坏:星穹铁道》中尝试应用AI工具管理角色行为、优化3D建模及生成NPC台词,并计划通过AI驱动实现“对话永不重复的智能NPC”。
米哈游的AI布局不仅限于游戏开发。2025年,该公司发布崩坏IP项目组AI专项招募计划,聚焦“AI驱动提效”与“AI驱动创新”,已搭建AI Agent平台Echo及多个游戏开发管线应用。米哈游三位创始人还通过捐赠助力上海交通大学“AI未来基石基金”,为技术人才储备铺路。从试验性AI游戏《Whispers from the Star》到AI聊天产品AnuNeko,再到如今的LPM 1.0,米哈游的技术进化路径逐渐清晰。其生活模拟新作《星布谷地》首次测试中已推出支持自由文字对话的AI NPC,进一步验证了AI与游戏结合的可行性。





















