LLM2D
边缘保持扩散模型噪声
Edge-preserving noise for diffusion models
作者: Jente Vandersanden, Sascha Holl, Xingchang Huang, Gurprit Singh
发布日期: 10/3/2024
arXiv ID: oai:arXiv.org:2410.01540v1

摘要

经典的生成扩散模型学习各向同性高斯去噪过程,对所有空间区域进行统一处理,从而忽略了数据中潜在的宝贵结构信息。受图像处理中各向异性扩散的长期研究成果启发,我们提出了一种新的边缘保持扩散模型,它是去噪扩散概率模型 (DDPM) 的推广。具体来说,我们引入了一种边缘感知噪声调度器,它在边缘保持和各向同性高斯噪声之间变化。我们证明了我们的模型的生成过程更快地收敛于更接近目标分布的结果。我们展示了它能够更好地学习数据集中的低频到中频,这在表示形状和结构信息方面起着至关重要的作用。我们的边缘保持扩散过程在无条件图像生成方面始终优于最先进的基线。对于由形状先验引导的生成任务(例如笔划到图像的生成)而言,它也更加稳健。我们展示了定性和定量结果,表明这两种任务的改进(FID 分数)始终高达 30%。