摘要
扩散模型 (DMs) 在无条件生成以及图像编辑和修复等应用方面表现出色。DMs 的成功在于扩散的迭代性质:扩散将将噪声映射到数据的复杂过程分解为一系列简单的去噪任务。此外,我们能够通过在每个去噪步骤中注入引导项来对生成过程进行细粒度控制。然而,迭代过程也计算量大,通常需要数十到数千次函数评估。虽然一致性轨迹模型 (CTMs) 能够在概率流 ODE (PFODE) 的任何时间点之间进行遍历,并通过单次函数评估进行分数推断,但 CTMs 仅允许从高斯噪声到数据的转换。本工作旨在通过提出广义 CTMs (GCTMs) 来释放 CTMs 的全部潜力,GCTMs 通过 ODE 在任意分布之间进行转换。我们讨论了 GCTMs 的设计空间,并展示了它们在各种图像操作任务中的有效性,例如图像到图像的转换、修复和编辑。