摘要
arXiv:2410.04844v3 通告类型: replace-cross
摘要:在图像编辑领域,存在三个核心挑战:可控性、背景保留和效率。基于反演的方法依赖于耗时的优化过程来保留初始图像的特征,这导致效率较低,因为需要进行大量的网络推理。相反,非反演方法缺乏在背景相似性方面的理论支持,因为他们通过避免保持初始特征来实现高效性。因此,这些方法无法同时实现高效率和背景一致性。为了应对这些挑战和上述缺点,我们引入了PostEdit方法,该方法结合了后验方案来控制扩散采样过程。具体而言,引入了一个与初始特征和朗格万动力学相关的对应度量项,以优化给定目标提示生成的估算图像。大量实验结果表明,提出的PostEdit实现了最先进的编辑性能,同时准确地保留了未编辑区域。此外,该方法既不需要反演,也不需要训练,仅需大约1.5秒和18GB的GPU内存即可生成高质量的结果。