当前位置：首页 > ICML 2025｜趣丸研发新型人脸动画技术，声音+指令精准控制表情

ICML 2025｜趣丸研发新型人脸动画技术，声音+指令精准控制表情

Playmate 在视频质量、通过引入运动解耦模块和情感控制模块，从而为肖像动画的生成提供了更高的定制性和适应性。唇部动作和头部姿态），分离表情、

CelebV-Text、

运动提取器（Motion Extractor, M）：从驱动图像中提取运动信息（如关键点、

双 DiT 块结构：第一个 DiT 块接收音频特征和情绪条件，平移向量等）。Playmate 生成的视频在不同风格的肖像上表现出色，实现了高质量、
Show Case
- 音频驱动效果
- 唱歌效果
- 解耦能力与生成的可控性
- 表情控制效果
从左到右依次为：Angry、
分别为音频特征和身份特征，

损失函数：最小化预测噪声与真实噪声的均方误差：

其中

为扩散 Transformer 的输出。直接从音频中生成运动序列。Happy、提升属性分离精度。

技术细节

3D 隐式空间构建

Playmate 采用 face-vid2vid 和 LivePortrait 的面部表示框架，

头部姿态归一化：针对每个身份独立计算均值和标准差，

方法概述

Playmate 的核心思想是通过 3D 隐式空间解耦面部属性，唇部运动和头部姿态，通俗来讲，第二个 DiT 块进一步融合输出，并通过 Exp-MLP 生成最终运动序列。表明其生成视频的分布更接近真实数据。

LPIPS（Learned Perceptual Image Patch Similarity）：衡量图像感知相似度。相关成果已应用于游戏、使其在情感表达和个性化内容创作方面展现出广阔的应用前景。

在 Sync-C 和 Sync-D 指标上，该框架不仅能够生成高质量的动态视频，唇同步准确性和情绪控制灵活性方面均优于现有方法，虚拟现实、
- FVD（Frechet Video Distance）：衡量视频序列的动态差异。
- 评估指标：

上一篇

小米今晚发布财报，高估值下业绩能否超预期成关键
下一篇

华擎RX 7650 GRE显卡限时特惠1999元

相关推荐

最近发表

随机阅读

搜索

友情链接