LLM2D
高效运动扩散模型:快速高质量运动生成的实现
EMDM: Efficient Motion Diffusion Model for Fast and High-Quality Motion Generation
作者: Wenyang Zhou, Zhiyang Dou, Zeyu Cao, Zhouyingcheng Liao, Jingbo Wang, Wenjia Wang, Yuan Liu, Taku Komura, Wenping Wang, Lingjie Liu
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2312.02256v3

摘要

我们提出了一种高效的运动扩散模型 (EMDM),用于快速生成高质量的人体运动。当前最先进的生成式扩散模型已经取得了令人印象深刻的成果,但在不牺牲质量的情况下难以实现快速生成。一方面,以往的工作,例如运动潜在扩散,在潜在空间内进行扩散以提高效率,但学习这样的潜在空间可能是一项非平凡的工作。另一方面,通过简单地增加采样步长(例如,DDIM)来加速生成,往往会导致质量下降,因为它无法逼近复杂的去噪分布。为了解决这些问题,我们提出了EMDM,它能够在扩散模型的多个采样步骤中捕获复杂的分布,从而减少采样步骤,显著加快生成速度。这是通过一个条件去噪扩散GAN来实现的,该GAN能够捕获任意(且可能更大)步长之间以控制信号为条件的多模态数据分布,从而实现高保真度和多样性的少步运动采样。为了最大限度地减少不需要的运动伪影,在网络学习过程中施加几何损失。因此,与现有方法相比,EMDM实现了实时运动生成,并显著提高了运动扩散模型的效率,同时实现了高质量的运动生成。我们的代码将在发表后公开发布。