LLM2D

摘要

arXiv:2505.05321v1 宣传类型: 综合交叉摘要：从高分辨率RGB图像中精确分割建筑物仍然是一个挑战，因为建筑物的光谱与非建筑物特征、阴影以及不规则的建筑物几何形状相似。在这项研究中，我们提出了一种全面的深度学习框架，用于使用从0.4米到2.7米不等的空间分辨率的RGB航空和卫星图像进行多尺度建筑物分割。我们精心制作了一个多传感器数据集，并通过从RGB通道中提取二次表示，包括主成分分析（PCA）、可见差异植被指数（VDVI）、形态学建筑物指数（MBI）和Sobel边缘滤波器来引入特征增强输入。这些特征在学习复杂的空间模式方面引导Res-U-Net架构，使其更为有效。我们还提出了一种训练策略，结合了层冻结、周期性学习率以及SuperConvergence，以减少训练时间和资源使用。在留出的WorldView-3图像上评估，我们的模型实现了96.5%的整体准确性、0.86的F1分数和0.80的交并比（IoU），超越了现有的基于RGB的基准。本研究展示了将多分辨率图像、特征增强和优化的训练策略结合应用于遥感应用中的鲁棒建筑物分割的有效性。