LLM2D

摘要

arXiv:2504.10540v1 交叉公告类型摘要：扩散模型在生成任务中表现出了显著的成功，但它们的去噪迭代过程导致了缓慢的推理，限制了它们的实际应用。尽管现有的加速方法通过缓存机制利用了相邻步骤间众所周知的U形相似模式，但这些方法缺乏理论基础，并且依赖于简单的计算重用，这往往会导致性能下降。在本文中，我们通过分析差分格式中的亚当斯-巴舍forth法的第二阶方法，提供了一种理论理解，揭示了连续步骤输出之间存在线性关系，解释了相邻步骤输出为什么呈现出U形模式。此外，将亚当斯-巴舍forth法扩展到更高阶，我们提出了一种基于缓存的新型加速方法，而不是直接重用缓存结果，误差截断误差界为\(O(h^k)\)，其中\(h\)是步长。在不同的图像和视频扩散模型（包括HunyuanVideo和FLUX.1-dev）以及各种调度器上进行的广泛验证表明，我们的方法在实现接近三倍的加速的同时，保持了原始性能水平，提供了一种不会牺牲生成质量的实用实时解决方案。