近日,一款名为LPM 1.0的基于视频的角色表演模型引发行业关注。该模型由Anuttacon技术团队成员AilingZeng公布,其核心能力在于实现实时说话、唱歌、倾听、反应以及细腻的表情呈现,为虚拟角色交互领域带来全新突破。
针对现有视频生成模型在表现力、实时推理及长时身份稳定性等方面的不足,Anuttacon团队构建了以人为中心的多模态数据集,训练出17B参数的Base LPM,并进一步将其蒸馏为低延迟流式的Online LPM。这一技术路径使得模型能够同时实现实时视频生成、无限时长下的身份一致性保持,以及拟人化表演的细腻度提升。团队还同步推出了交互角色表演基准LPM-Bench,在多项评估指标中达到行业领先水平,为对话代理、直播角色及游戏NPC等场景提供了通用视觉引擎解决方案。
从技术实现来看,LPM 1.0支持多模态输入,用户可通过单张图片、可选参考图片、音频及文本的组合生成角色表演视频。例如,在一段45分钟演示对话中,基于Online LPM 480P型号生成的角色展现了自然的言语节奏、目光转移及微表情变化,甚至在回应前会出现符合人类交流习惯的停顿。这种全双工交互模式允许对话双方同时说话、随时打断,模拟真实面对面聊天的体验。
为解决角色身份稳定性难题,模型采用多维度参考要素,包括全局外观、多视角身体图像及面部表情素材,有效避免牙齿、表情纹路等细节的错误生成。同时,该模型对角色风格具有广泛适应性,无需微调即可处理写实、2D动漫、3D游戏及非类人生物等不同风格输入,显著降低了应用门槛。
在非对话场景中,LPM 1.0同样展现出技术优势。当角色独处时,模型可生成真实的呼吸节奏、自然的肢体动作及准确的情感表达,进一步拓展了虚拟角色的应用边界。与同类产品相比,该模型在视觉忠实度、口型同步精度、身份保护及自然感方面表现突出,尤其支持任意长度内容生成,突破了部分竞品30秒的内容限制。
尽管技术亮点显著,但Anuttacon团队目前并无公开模型权重、源代码或提供在线演示的计划。此次发布主要聚焦于展示研究进展,为学术交流提供参考,同时释放出强烈的人才招募信号。行业观察人士指出,结合Anuttacon成立初期提出的AI原生游戏引擎级平台构想,以及米哈游在《崩坏:星穹铁道》中AI工具的应用实践,LPM 1.0的推出或标志着该团队在虚拟角色交互领域的技术积累进入新阶段。
米哈游近年来的AI布局呈现系统化特征。从2023年《崩坏:星穹铁道》团队探索AI在角色行为管理、3D建模调优等领域的应用,到2025年发布AI专项招募计划搭建Agent平台Echo,再到虚拟角色鹿鸣及新作《星布谷地》中AI NPC的实践,其技术路线逐渐清晰。三位创始人通过捐赠设立“AI未来基石基金”的举措,进一步凸显了其对AI人才储备的重视。这些动作共同勾勒出一家游戏企业向AI技术深水区探索的轨迹,而LPM 1.0的亮相,或成为其虚拟世界战略中的关键拼图。














