摘要
arXiv:2502.05147v2 宣传类型: replace-cross
摘要: 本文提出了LP-DETR(层级渐进DETR),这是一种通过多尺度关系建模来增强DETR基础目标检测的方法。我们的方法通过关系感知的自我注意机制引入了可学习的对象查询之间的空间关系,在解码器层中自适应地学习平衡不同尺度的关系(局部、中等和全局)。这种渐进式设计使模型能够有效地在整个检测管道中捕捉不断变化的空间依赖关系。在COCO 2017数据集上的大量实验表明,与标准的自我注意模块相比,我们的方法在收敛速度和检测精度上均有所提高。所提出的该方法取得了具有竞争力的结果,使用ResNet-50骨干网络在12个周期和24个周期时分别达到了52.3%的AP和52.5%的AP,并进一步使用Swin-L骨干网络提高到58.0%的AP。此外,我们的分析揭示了一个有趣的现象:模型自然地在早期解码器层中优先学习局部空间关系,而随着层的加深逐渐开始关注更广泛的上下文,这为未来在目标检测方面的研究提供了宝贵的见解。