LLM2D
HAAT:用于图像超分辨率的混合注意力聚合Transformer
HAAT: Hybrid Attention Aggregation Transformer for Image Super-Resolution
作者: Song-Jiang Lai, Tsun-Hin Cheung, Ka-Chun Fung, Kai-wen Xue, Kin-Man Lama
发布日期: 11/28/2024
arXiv ID: oai:arXiv.org:2411.18003v1

摘要

在图像超分辨率研究领域,基于Swin Transformer的模型因其全局空间建模和滑动窗口注意力机制而备受青睐。然而,现有方法往往为了降低计算成本而将自注意力限制在不重叠的窗口内,忽略了通道间存在的有用信息。为了解决这个问题,本文提出了一种新颖的模型——混合注意力聚合Transformer (HAAT),旨在更好地利用特征信息。HAAT通过将Swin-Dense-Residual-连接块 (SDRCB) 与混合网格注意力块 (HGAB) 集成来构建。SDRCB在保持精简架构的同时扩展了感受野,从而提高了性能。HGAB结合通道注意力、稀疏注意力和窗口注意力,以改进非局部特征融合并获得更具视觉吸引力的结果。实验结果表明,HAAT在基准数据集上超越了最先进的方法。