LLM2D
RingMo-航空:一种带有仿射变换对比学习的航空遥感基础模型
RingMo-Aerial: An Aerial Remote Sensing Foundation Model With A Affine Transformation Contrastive Learning
作者: Wenhui Diao, Haichen Yu, Kaiyue Kang, Tong Ling, Di Liu, Yingchao Feng, Hanbo Bi, Libo Ren, Xuexue Li, Yongqiang Mao, Xian Sun
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2409.13366v2

摘要

arXiv:2409.13366v2 通知类型: 更新-交叉 摘要:空中遥感(ARS)视觉任务由于其独特的视角特性,面临着重大的挑战。现有研究主要集中在特定任务的算法上,这在广泛范围的ARS视觉应用中应用有限。本文提出RingMo-Aerial模型,旨在填补ARS视觉领域基础模型研究的空白。通过引入频率增强多头自注意力(FE-MSA)机制以及基于仿射变换的对比学习预训练方法,模型在倾斜视角方面的小目标检测能力得到了增强和优化。此外,提出了ARS-Adapter高效参数微调方法,以提高模型在各种ARS视觉任务中的适应性和有效性。实验结果表明,RingMo-Aerial在多个下游任务上实现了最佳性能。这表明RingMo-Aerial在增强ARS视觉任务性能方面具备实际应用价值和有效性。