摘要
arXiv:2504.17822v1 通知类型: cross
摘要: 北极地区的反进退冻融沉陷(RTS)是具有显著环境影响的独特永久冻土地貌。准确绘制这些RTS是至关重要的,因为它们的出现是永久冻土解冻的明显指示。然而,相对于其他地貌特征的较小规模、模糊边界以及时空变化,对它们的准确检测具有显著挑战。本文中,我们采用了最先进的深度学习模型——多尺度视觉变换器为基础的级联掩码R-CNN,来在北极地区划定RTS特征。引入了两种新的策略来优化多模态学习并提升模型的预测性能:(1)一种特征级别残余跨模态注意融合策略,该策略有效地将多种模态的特征图融合,捕获互补信息,并提高模型理解数据中复杂模式和关系的能力;(2)预先训练单模态学习,然后进行多模态微调,以降低计算需求,同时实现强大的模型性能。实验结果表明,我们的方法在数据级别融合、特征级别卷积融合以及各种注意融合策略中表现出众,提供了有关如何高效利用多模态数据进行RTS制图的宝贵见解。这项研究有助于我们对永久冻土地貌及其环境影响的理解。