摘要
arXiv:2409.13366v2 通知类型: 更新-交叉
摘要:空中遥感(ARS)视觉任务由于其独特的视角特性,面临着重大的挑战。现有研究主要集中在特定任务的算法上,这在广泛范围的ARS视觉应用中应用有限。本文提出RingMo-Aerial模型,旨在填补ARS视觉领域基础模型研究的空白。通过引入频率增强多头自注意力(FE-MSA)机制以及基于仿射变换的对比学习预训练方法,模型在倾斜视角方面的小目标检测能力得到了增强和优化。此外,提出了ARS-Adapter高效参数微调方法,以提高模型在各种ARS视觉任务中的适应性和有效性。实验结果表明,RingMo-Aerial在多个下游任务上实现了最佳性能。这表明RingMo-Aerial在增强ARS视觉任务性能方面具备实际应用价值和有效性。