LLM2D
SO-DETR:利用双域特征和知识蒸馏进行小对象检测
SO-DETR: Leveraging Dual-Domain Features and Knowledge Distillation for Small Object Detection
作者: Huaxiang Zhang, Hao Zhang, Aoran Mei, Zhongxue Gan, Guo-Niu Zhu
发布日期: 4/17/2025
arXiv ID: oai:arXiv.org:2504.11470v1

摘要

arXiv:2504.11470v1 命名类型: cross 摘要:基于检测变换器的方法在通用目标检测方面取得了重大进展。然而,有效检测小目标仍然存在挑战。一个关键难题是现有编码器在高效融合低级特征方面存在困难。此外,查询选择策略也没有很好地针对小目标进行调整。为了解决这些挑战,本文提出了一种高效的模型,名为小型对象检测变换器(SO-DETR)。该模型包括三个关键组件:一个基于双域的混合编码器、一种增强的查询选择机制和一种知识蒸馏策略。基于双域的混合编码器将空间域和频率域结合起来,有效地融合了多尺度特征。这种方法增强了高分辨率特征的表示,同时保持相对较低的计算开销。增强的查询选择机制通过使用扩展的IoU动态选择高分锚框来优化查询初始化,从而提高查询资源的分配。此外,通过引入轻量级骨干网络并实现知识蒸馏策略,我们为小目标开发了一种高效的检测器。在VisDrone-2019-DET和UAVVaste数据集上的实验结果表明,SO-DETR在与现有方法相似的计算需求下表现出色。项目页面可在https://github.com/ValiantDiligent/SO_DETR获取。