摘要
arXiv:2504.10540v1 交叉公告类型
摘要:扩散模型在生成任务中表现出了显著的成功,但它们的去噪迭代过程导致了缓慢的推理,限制了它们的实际应用。尽管现有的加速方法通过缓存机制利用了相邻步骤间众所周知的U形相似模式,但这些方法缺乏理论基础,并且依赖于简单的计算重用,这往往会导致性能下降。在本文中,我们通过分析差分格式中的亚当斯-巴舍forth法的第二阶方法,提供了一种理论理解,揭示了连续步骤输出之间存在线性关系,解释了相邻步骤输出为什么呈现出U形模式。此外,将亚当斯-巴舍forth法扩展到更高阶,我们提出了一种基于缓存的新型加速方法,而不是直接重用缓存结果,误差截断误差界为\(O(h^k)\),其中\(h\)是步长。在不同的图像和视频扩散模型(包括HunyuanVideo和FLUX.1-dev)以及各种调度器上进行的广泛验证表明,我们的方法在实现接近三倍的加速的同时,保持了原始性能水平,提供了一种不会牺牲生成质量的实用实时解决方案。