LLM2D

摘要

arXiv:2504.01243v2 宣告类型: replace-cross 摘要：水下图像受到严重的退化，包括颜色失真、可见度降低和由于波长依赖的衰减和散射而导致的结构细节丢失。现有的增强方法主要集中在空域处理上，忽视了频域捕获全局颜色分布和长程依赖性的潜力。为了解决这些限制，我们提出了一种双重域深度学习框架FUSION，该框架联合利用空域和频域信息。FUSION在空域中通过多尺度卷积核和自适应注意力机制独立处理每个RGB通道，同时通过基于FFT的频域注意力提取全局结构信息。一个频域引导融合模块将两个域中的互补特征结合在一起，随后进行了跨通道融合和自适应通道重校准，以确保颜色分布的平衡。在基准数据集（UIEB、EUVP、SUIM-E）上的广泛实验表明，FUSION获得了最先进的性能，一致地在重建保真度（UIEB上的最高PSNR为23.717 dB和SSIM为0.883）、感知质量（UIEB上的最低LPIPS为0.112）和视觉增强度量（UIEB上的最高UIQM为3.414）方面优于现有方法，同时所需参数明显较少（0.28M）且计算复杂度更低，这表明FUSION适合实时水下成像应用。