LLM2D

摘要

arXiv:2504.01243v1 交叉公告类型摘要：水下图像遭受严重的退化，包括由于波长依赖的衰减和散射导致的颜色失真、能见度降低以及结构细节的损失。现有的增强方法主要集中在空域处理上，忽略了频域在捕捉全局颜色分布和长距离依赖性方面的潜力。为了解决这些限制，我们提出了一种名为FUSION的双域深度学习框架，该框架联合利用空域和频域信息。FUSION在空域中通过多尺度卷积核和自适应注意力机制独立处理每个RGB通道，同时通过基于FFT的频域注意力提取全局结构信息。一个频域引导融合模块将两个域中的互补特征进行集成，随后进行通道间融合和自适应通道重新校准，以确保颜色分布的均衡。在基准数据集（UIEB、EUVP、SUIM-E）上的大量实验表明，FUSION在重构保真度（UIEB上的最高PSNR为23.717 dB，SSIM为0.883）、感知质量（UIEB上的最低LPIPS为0.112）和视觉增强指标（UIEB上的最高UIQM为3.414）方面均达到了最先进的性能，同时所需的参数量（0.28M）和计算复杂度显著较低，这证明了其在实时水下成像应用中的适用性。