LLM2D

摘要

arXiv:2411.19339v2 宣告类型: replace-cross 摘要：我们提出了一种简单的、无需训练的机制，用于解释扩散模型的泛化行为。通过将预训练的扩散模型与其理论上的最优经验对应物进行比较，我们发现了一种跨越多种网络架构的共享局部归纳偏差。基于这一观察，我们假设网络除噪器通过局部除噪操作泛化，因为这些操作在培训分布的大部分范围内很好地近似了训练目标。为了验证我们的假设，我们引入了新型除噪算法，将局部经验除噪器聚集起来以复制网络行为。在正向和反向扩散过程中的网络除噪器与这些算法进行比较时，我们的方法在视觉上与神经网络输出一致，并且均方误差低于之前提出的其他方法。