摘要
arXiv:2504.17825v1 交叉类型: cross
摘要: 最近的图像恢复方法大多采用具有U-Net骨干的潜在扩散模型,但由于其能力有限,仍然面临着实现高质量恢复的挑战。随着扩散变换器(DiT)如SD3的出现,因为它们在保质性和扩展性方面具有更好的效果,成为了一种有前景的替代方案。在本文中,我们介绍了DPIR (双提示图像恢复),这是一种新颖的图像恢复方法,能够有效地从多个角度提取低质量图像的条件信息。具体而言,DPIR 包含两个分支:一个低质量图像条件分支和一个双提示控制分支。第一个分支利用一个轻量级模块以高效的方式将图像先验信息整合到DiT中。更重要的是,我们相信在图像恢复中,仅依靠文本描述无法全面捕捉其丰富的视觉特征。因此,我们设计了一个双提示模块,以向DiT提供额外的视觉线索,既捕捉全局上下文又捕捉局部外观。提取的全局-局部视觉提示作为额外的条件控制,与文本提示一起形成双提示,大大提升了恢复质量。大量的实验结果表明,DPIR 在图像恢复性能方面表现出色。