摘要
arXiv:2504.15165v1 宣告类型: cross
摘要: 无人机(UAV)平台进行空域物体检测面临着严重的挑战,包括小于10像素的目标、密集遮挡和严格的计算约束。现有的检测器在精度和效率之间难以平衡,主要是由于僵化的感受野和冗余的架构。为了解决这些局限性,我们提出了具有变感受野的DETR (VRF-DETR) 检测器,该检测器结合了三个核心技术组件:1) 多尺度上下文融合(MSCF)模块,通过自适应空间注意和门控多尺度融合动态重新校准特征;2) 门控卷积(GConv)层,通过深度可分离操作和动态门控实现参数高效的地方上下文建模;3) 通过级联的全局-局部交互逐级解缠遮挡物体的门控多尺度融合(GMCF)瓶颈。在VisDrone2019数据集上的实验表明,VRF-DETR仅使用13.5百万个参数即可达到51.4%的mAP_50和31.8%的mAP_50:95。这项工作为无人机检测任务建立了新的效率-准确性的非劣解前沿。