蔡浩宇AI公司LPM 1.0问世：视频角色表演模型开启新探索之路-移动互联-虎科技

蔡浩宇AI公司LPM 1.0问世：视频角色表演模型开启新探索之路

时间：2026-04-11 15:56 来源：天脉网作者：赵云飞

近日，一款名为LPM 1.0的基于视频的角色表演模型引发行业关注。该模型由Anuttacon技术团队成员AilingZeng公布，其核心能力在于实现实时说话、唱歌、倾听、反应以及细腻的表情呈现，为虚拟角色交互领域带来全新突破。

针对现有视频生成模型在表现力、实时推理及长时身份稳定性等方面的不足，Anuttacon团队构建了以人为中心的多模态数据集，训练出17B参数的Base LPM，并进一步将其蒸馏为低延迟流式的Online LPM。这一技术路径使得模型能够同时实现实时视频生成、无限时长下的身份一致性保持，以及拟人化表演的细腻度提升。团队还同步推出了交互角色表演基准LPM-Bench，在多项评估指标中达到行业领先水平，为对话代理、直播角色及游戏NPC等场景提供了通用视觉引擎解决方案。

从技术实现来看，LPM 1.0支持多模态输入，用户可通过单张图片、可选参考图片、音频及文本的组合生成角色表演视频。例如，在一段45分钟演示对话中，基于Online LPM 480P型号生成的角色展现了自然的言语节奏、目光转移及微表情变化，甚至在回应前会出现符合人类交流习惯的停顿。这种全双工交互模式允许对话双方同时说话、随时打断，模拟真实面对面聊天的体验。

为解决角色身份稳定性难题，模型采用多维度参考要素，包括全局外观、多视角身体图像及面部表情素材，有效避免牙齿、表情纹路等细节的错误生成。同时，该模型对角色风格具有广泛适应性，无需微调即可处理写实、2D动漫、3D游戏及非类人生物等不同风格输入，显著降低了应用门槛。

在非对话场景中，LPM 1.0同样展现出技术优势。当角色独处时，模型可生成真实的呼吸节奏、自然的肢体动作及准确的情感表达，进一步拓展了虚拟角色的应用边界。与同类产品相比，该模型在视觉忠实度、口型同步精度、身份保护及自然感方面表现突出，尤其支持任意长度内容生成，突破了部分竞品30秒的内容限制。

尽管技术亮点显著，但Anuttacon团队目前并无公开模型权重、源代码或提供在线演示的计划。此次发布主要聚焦于展示研究进展，为学术交流提供参考，同时释放出强烈的人才招募信号。行业观察人士指出，结合Anuttacon成立初期提出的AI原生游戏引擎级平台构想，以及米哈游在《崩坏：星穹铁道》中AI工具的应用实践，LPM 1.0的推出或标志着该团队在虚拟角色交互领域的技术积累进入新阶段。

米哈游近年来的AI布局呈现系统化特征。从2023年《崩坏：星穹铁道》团队探索AI在角色行为管理、3D建模调优等领域的应用，到2025年发布AI专项招募计划搭建Agent平台Echo，再到虚拟角色鹿鸣及新作《星布谷地》中AI NPC的实践，其技术路线逐渐清晰。三位创始人通过捐赠设立“AI未来基石基金”的举措，进一步凸显了其对AI人才储备的重视。这些动作共同勾勒出一家游戏企业向AI技术深水区探索的轨迹，而LPM 1.0的亮相，或成为其虚拟世界战略中的关键拼图。

更多>同类内容

AI浪潮下：旧岗位消逝与新机遇涌现，你能否	捷途XWD技术体验日启幕硬核技术赋能旅行
拼多多“免费送货入村”：打通乡村物流末梢	A股2026年退市格局生变：市值退市领衔，多