LLM2D

摘要

条件扩散模型可以在各种环境下创建看不见的图像，帮助图像插值。潜空间插值已被充分研究，但具有文本或姿势等特定条件的插值了解较少。简单的方法，例如条件空间中的线性插值，通常会导致图像缺乏一致性、平滑度和保真度。为此，我们介绍了一种名为“通过扩散的注意力插值 (AID)” 的新型无训练技术。我们的主要贡献包括：1) 提出了一个内/外插值注意力层；2) 将插值注意力与自注意力融合以提高保真度；3) 应用贝塔分布进行选择以提高平滑度。我们还提出了一种变体，即“通过扩散的提示引导注意力插值 (PAID)”，它将插值视为一个条件相关的生成过程。该方法能够创建具有更高一致性、平滑度和效率的新图像，并提供对插值精确路径的控制。我们的方法证明了在概念和空间插值方面的有效性。代码和演示可在 https://github.com/QY-H00/attention-interpolation-diffusion 获取。