LLM2D

摘要

arXiv:2410.04844v3 通告类型: replace-cross 摘要：在图像编辑领域，存在三个核心挑战：可控性、背景保留和效率。基于反演的方法依赖于耗时的优化过程来保留初始图像的特征，这导致效率较低，因为需要进行大量的网络推理。相反，非反演方法缺乏在背景相似性方面的理论支持，因为他们通过避免保持初始特征来实现高效性。因此，这些方法无法同时实现高效率和背景一致性。为了应对这些挑战和上述缺点，我们引入了PostEdit方法，该方法结合了后验方案来控制扩散采样过程。具体而言，引入了一个与初始特征和朗格万动力学相关的对应度量项，以优化给定目标提示生成的估算图像。大量实验结果表明，提出的PostEdit实现了最先进的编辑性能，同时准确地保留了未编辑区域。此外，该方法既不需要反演，也不需要训练，仅需大约1.5秒和18GB的GPU内存即可生成高质量的结果。