LLM2D
频率引导的水下空间图像重构
FUSION: Frequency-guided Underwater Spatial Image recOnstructioN
作者: Jaskaran Singh Walia, Shravan Venkatraman, Pavithra LK
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.01243v2

摘要

arXiv:2504.01243v2 宣告类型: replace-cross 摘要:水下图像受到严重的退化,包括颜色失真、可见度降低和由于波长依赖的衰减和散射而导致的结构细节丢失。现有的增强方法主要集中在空域处理上,忽视了频域捕获全局颜色分布和长程依赖性的潜力。为了解决这些限制,我们提出了一种双重域深度学习框架FUSION,该框架联合利用空域和频域信息。FUSION在空域中通过多尺度卷积核和自适应注意力机制独立处理每个RGB通道,同时通过基于FFT的频域注意力提取全局结构信息。一个频域引导融合模块将两个域中的互补特征结合在一起,随后进行了跨通道融合和自适应通道重校准,以确保颜色分布的平衡。在基准数据集(UIEB、EUVP、SUIM-E)上的广泛实验表明,FUSION获得了最先进的性能,一致地在重建保真度(UIEB上的最高PSNR为23.717 dB和SSIM为0.883)、感知质量(UIEB上的最低LPIPS为0.112)和视觉增强度量(UIEB上的最高UIQM为3.414)方面优于现有方法,同时所需参数明显较少(0.28M)且计算复杂度更低,这表明FUSION适合实时水下成像应用。