LLM2D
GCA-SUNet:一种门控上下文意识Swin-UNet,用于无示例计数
GCA-SUNet: A Gated Context-Aware Swin-UNet for Exemplar-Free Counting
作者: Yuzhe Wu, Yipeng Xu, Tianyu Xu, Jialu Zhang, Jianfeng Ren, Xudong Jiang
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2409.12249v2

摘要

arXiv:2409.12249v2 通告类型: 交叉替换 摘要: 无范例计数旨在无需对物体或范例进行密集注释的情况下,计数感兴趣的目标物体。为此,我们提出了一种门控上下文感知 Swin-UNet (GCA-SUNet) 来直接将输入图像映射为可计数物体的密度图。具体而言,由一组 Swin 变形器形成的编码器用于提取 robust 特征表示,而设计了一种门控上下文感知调制块,通过门机制抑制不相关的物体或背景,并通过自相似矩阵利用对感兴趣物体的注意力支持。门控策略也被整合到Swin-UNet 的瓶颈网络和解码器中,以突出最相关于感兴趣物体的特征。通过明确利用可计数物体之间的注意力支持,并通过门机制消除不相关特征,提出的 GCA-SUNet 集中于并计数感兴趣物体,而无需依赖预定义的类别或范例。在实时数据集如 FSC-147 和 CARPK 上的实验结果表明,GCA-SUNet 在现有方法中显著且一致地表现更优。代码可在 https://github.com/Amordia/GCA-SUNet 获取。