LLM2D
FUSION: 频率导向的水下空间图像重构
FUSION: Frequency-guided Underwater Spatial Image recOnstructioN
作者: Jaskaran Singh Walia, Shravan Venkatraman, Pavithra LK
发布日期: 4/3/2025
arXiv ID: oai:arXiv.org:2504.01243v1

摘要

arXiv:2504.01243v1 交叉公告类型 摘要:水下图像遭受严重的退化,包括由于波长依赖的衰减和散射导致的颜色失真、能见度降低以及结构细节的损失。现有的增强方法主要集中在空域处理上,忽略了频域在捕捉全局颜色分布和长距离依赖性方面的潜力。为了解决这些限制,我们提出了一种名为FUSION的双域深度学习框架,该框架联合利用空域和频域信息。FUSION在空域中通过多尺度卷积核和自适应注意力机制独立处理每个RGB通道,同时通过基于FFT的频域注意力提取全局结构信息。一个频域引导融合模块将两个域中的互补特征进行集成,随后进行通道间融合和自适应通道重新校准,以确保颜色分布的均衡。在基准数据集(UIEB、EUVP、SUIM-E)上的大量实验表明,FUSION在重构保真度(UIEB上的最高PSNR为23.717 dB,SSIM为0.883)、感知质量(UIEB上的最低LPIPS为0.112)和视觉增强指标(UIEB上的最高UIQM为3.414)方面均达到了最先进的性能,同时所需的参数量(0.28M)和计算复杂度显著较低,这证明了其在实时水下成像应用中的适用性。