摘要
arXiv:2505.05599v1 宣布类型: cross
摘要:在卫星图像中进行目标定位特别具有挑战性,主要原因在于对象的高度变异性、低空间分辨率以及由噪声、云朵和城市灯光等主要特征引起的干扰。在本研究中,我们关注三个卫星数据集:上层大气重力波(GW)、中层大气博罗(Bore)和海洋涡旋(OE),每个数据集都具有其独特的挑战。这些挑战包括主要对象模式在规模和外观上的变化,其中目标对象的大小、形状和特征扩展可以显著不同。为了解决这些挑战,我们提出了一种名为YOLO-DCAP的新型增强版YOLOv5,旨在改善这些复杂场景下的目标定位。YOLO-DCAP集成了多尺度扩张残差卷积(MDRC)块,以在变化的扩张率下捕捉多尺度特征,并集成了注意力辅助空间池化(AaSP)模块,以聚焦于全局相关的空间区域,从而增强特征选择。这些结构改进有助于更好地在卫星图像中定位物体。实验结果表明,YOLO-DCAP显著优于YOLO基模型和最先进的方法,在基模型上分别实现了mAP50平均提高20.95%和IoU提高32.23%,在最先进的替代方法上分别提高7.35%和9.84%,并且在所有三个卫星数据集中均保持一致。这些在所有三个卫星数据集中的持续提升突显了所提方法的稳健性和适用性。我们的代码已在 https://github.com/AI-4-atmosphere-remote-sensing/satellite-object-localization 公开发布。