摘要
arXiv:2502.00688v1 交叉公告类型
摘要:一次性捷径扩散模型【Frans, Hafner, Levine and Abbeel, ICLR 2025】在视觉生成方面显示出潜力,但它们依赖于一阶轨迹监督,这在根本上是有限制的。捷径模型的简单只速度方法无法捕捉内在流形几何结构,导致轨迹不稳、几何对齐差以及不稳定性,特别是在高曲率区域更为明显。这些不足之处源自其无法建模中等时间依赖性或复杂分布特征,使其在稳健生成建模方面无能为力。在本文中,我们介绍了一种名为HOMO(高阶匹配的一次性捷径扩散模型)的革新框架,它利用高阶监督彻底改革了分布传输。通过引入加速度、冲击加速度以及其他更高级的参数,HOMO不仅纠正了捷径模型的缺陷,还实现了前所未有的平滑度、稳定性和几何精度。理论上,我们证明了HOMO的高阶监督确保了更优的近似准确性,超越了一阶方法。实验上,HOMO在复杂设置中表现优异,特别是在捷径模型难以处理的高曲率区域。我们的实验结果表明,HOMO提供了更平滑的轨迹和更好的分布对齐,为一次性生成模型设定了新的标准。