摘要
arXiv:2412.20104v4 通告类型: replace-cross
摘要: 在VR/AR和人体动画中,合成现实的人体-物体交互动作是一个关键问题。不同于通常研究的只涉及单个个体或手与一个物体交互的场景,我们关注的是包含任意数量的人、手和物体的更通用的多体体系结构。这种复杂性带来了在同步动作时由于不同身体间的高相关性和相互影响所带来的重大挑战。为了解决这些挑战,我们引入了SyncDiff,这是一种使用同步运动扩散策略的多体交互合成的新方法。SyncDiff采用单一的扩散模型来捕捉多体动作的联合分布。为了提高动作的真实性,我们提出了一种基于频域的动作分解方案。此外,我们引入了一组新的对齐得分,以强调不同身体动作之间的同步。SyncDiff通过显式的同步策略联合优化数据样本似然性和对齐似然性。在四个具有不同多体配置的数据集上的广泛实验表明,SyncDiff在现有最先进的动作合成方法中表现更优。