摘要
条件扩散模型可以在各种环境下创建看不见的图像,帮助图像插值。潜空间插值已被充分研究,但具有文本或姿势等特定条件的插值了解较少。简单的方法,例如条件空间中的线性插值,通常会导致图像缺乏一致性、平滑度和保真度。为此,我们介绍了一种名为“通过扩散的注意力插值 (AID)” 的新型无训练技术。我们的主要贡献包括:1) 提出了一个内/外插值注意力层;2) 将插值注意力与自注意力融合以提高保真度;3) 应用贝塔分布进行选择以提高平滑度。我们还提出了一种变体,即“通过扩散的提示引导注意力插值 (PAID)”,它将插值视为一个条件相关的生成过程。该方法能够创建具有更高一致性、平滑度和效率的新图像,并提供对插值精确路径的控制。我们的方法证明了在概念和空间插值方面的有效性。代码和演示可在 https://github.com/QY-H00/attention-interpolation-diffusion 获取。