摘要
arXiv:2411.19339v2 宣告类型: replace-cross
摘要:我们提出了一种简单的、无需训练的机制,用于解释扩散模型的泛化行为。通过将预训练的扩散模型与其理论上的最优经验对应物进行比较,我们发现了一种跨越多种网络架构的共享局部归纳偏差。基于这一观察,我们假设网络除噪器通过局部除噪操作泛化,因为这些操作在培训分布的大部分范围内很好地近似了训练目标。为了验证我们的假设,我们引入了新型除噪算法,将局部经验除噪器聚集起来以复制网络行为。在正向和反向扩散过程中的网络除噪器与这些算法进行比较时,我们的方法在视觉上与神经网络输出一致,并且均方误差低于之前提出的其他方法。