LLM2D
压缩图像生成的去噪扩散码本模型
Compressed Image Generation with Denoising Diffusion Codebook Models
作者: Guy Ohayon, Hila Manor, Tomer Michaeli, Michael Elad
发布日期: 2/5/2025
arXiv ID: 2502.01189

摘要

arXiv:2502.01189v2 宣布类型: replace-cross 摘要:我们提出了一种基于去噪扩散模型(Denoising Diffusion Models, DDMs)的新颖生成方法,该方法可以生成高质量的图像样本以及其无损压缩位流表示。这是通过将反向扩散中的标准高斯噪声采样替换为从预定义的固定iid高斯向量代码本中选择噪声样本来实现的。令人惊讶的是,我们发现我们的方法——称为去噪扩散代码本模型(Denoising Diffusion Codebook Model, DDCM)——即使对于极小的代码本也能保留与标准DDM相同的样本质量和多样性。利用DDCM,我们选择了最好匹配给定图像的噪声样本,将我们的生成模型转换为一种非常有效的有损图像编解码器,实现了最先进的感知图像压缩效果。更一般地,通过设置其他噪声选择规则,我们将我们的压缩方法扩展到任何条件图像生成任务(例如图像恢复),其中生成的图像与其紧凑的位流表示是联合生成的。我们的工作附带了对所提出压缩条件生成方案的数学解释,建立了与所考虑任务中的基于评分的后验采样器近似方法之间的联系。