LLM2D
DisCoRD: 从离散标记到连续运动的Rectified流解码
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding
作者: Jungbin Cho, Junwan Kim, Jisoo Kim, Minseo Kim, Mingu Kang, Sungeun Hong, Tae-Hyun Oh, Youngjae Yu
发布日期: 4/21/2025
arXiv ID: oai:arXiv.org:2411.19527v3

摘要

arXiv:2411.19527v3 Announce Type: replace-cross 摘要:人类动作是固有的连续和动态的,给生成模型带来了重大挑战。虽然离散生成方法被广泛使用,但它们在表现力和帧间噪声伪影方面存在局限性。相比之下,连续方法可以生成更平滑、更自然的动作,但往往难以遵守条件信号,原因在于高维复杂性和有限的训练数据。为了弥合离散和连续表示之间的分歧,我们引入了DisCoRD:通过矫正流解码从离散动作标记到连续动作的空间,这是一种新颖的方法,利用矫正流来在连续的原始动作空间中解码离散的动作标记。我们的核心思想是将动作标记解码视为条件生成任务,确保DisCoRD捕捉到细微的动力学并生成更平滑、更自然的动作。我们的方法与任何基于离散的框架兼容,在各种设置中可以增强自然性而不影响对条件信号的忠实度。全面评估 我们项目的网页可用于此:https://whwjdqls.github.io/discord.github.io/。