LLM2D
CDFormer: 针对特征混淆的跨域few-shot目标检测变换器
CDFormer: Cross-Domain Few-Shot Object Detection Transformer Against Feature Confusion
作者: Boyuan Meng, Xiaohan Zhang, Peilin Li, Zhe Wu, Yiming Li, Wenkai Zhao, Beinan Yu, Hui-Liang Shen
发布日期: 5/5/2025
arXiv ID: oai:arXiv.org:2505.00938v1

摘要

arXiv:2505.00938v1 Announce Type: cross 摘要:跨域少量样本目标检测(CD-FSOD)旨在在有限的类别实例的情况下,在不同的领域检测新型目标。特征混淆,包括目标-背景混淆和目标-目标混淆,在跨域和少量样本设置中都提出了显著的挑战。在这项工作中,我们引入了CDFormer,这是一种针对特征混淆的跨域少量样本目标检测变换器,以解决这些挑战。该方法通过两个关键模块具体解决了特征混淆:目标-背景区分(OBD)和目标-目标区分(OOD)。OBD模块利用可学习的背景标记来区分目标和背景,而OOD模块增强了不同类别目标之间的区分能力。实验结果表明,CDFormer在微调后分别在1/5/10 shot设置中比以前的最先进方法提高了12.9%、11.0%和10.4%的mAP。