LLM2D
RingMo-Aerial:一种基于仿射变换对比学习的航空遥感基础模型
RingMo-Aerial: An Aerial Remote Sensing Foundation Model With A Affine Transformation Contrastive Learning
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.13366v1

摘要

arXiv:2409.13366v1 公告类型: 交叉 摘要: 空中遥感(ARS)视觉任务由于其独特的视角特性而面临重大挑战。现有研究主要集中在特定任务的算法上,这些算法在广泛的ARS视觉应用中的适用性有限。本文提出了RingMo-Aerial模型,旨在填补ARS视觉领域基础模型研究的空白。通过引入频率增强的多头自注意力(FE-MSA)机制和基于仿射变换的对比学习预训练方法,该模型对小目标的检测能力得到增强,并优化了ARS特有的倾斜视角。此外,提出了ARS-Adapter,一种高效的参数微调方法,以提高模型在各种ARS视觉任务中的适应性和有效性。实验结果表明,RingMo-Aerial在多个下游任务中达到了最先进的性能。这表明RingMo-Aerial在提升ARS视觉任务性能方面的实用性和有效性。