LLM2D

摘要

作物田地边界是农业监测和评估的基础数据集，但人工收集成本很高。从遥感图像中自动提取田地边界的机器学习 (ML) 方法可以帮助实现全球范围内对这些数据集的需求。然而，现有的用于田地实例分割的 ML 方法缺乏足够的地理覆盖范围、准确性和泛化能力。此外，由于缺乏代表全球农业田地多样性的标记数据集，改进 ML 方法的研究受到限制。我们提出了“世界田地” (FTW)——一个新的 ML 基准数据集，用于农业田地实例分割，涵盖四大洲（欧洲、非洲、亚洲和南美洲）的 24 个国家。FTW 比以前的数据集大一个数量级，包含 70,462 个样本，每个样本都包含实例和语义分割掩码，与多日期、多光谱 Sentinel-2 卫星图像配对。我们提供了新 FTW 基准的基线模型结果，表明在 FTW 上训练的模型在保留国家中比没有使用多样化数据集预训练的模型具有更好的零样本和微调性能，并且在现实场景中展示了 FTW 模型的积极定性零样本结果——在埃塞俄比亚运行 Sentinel-2 场景。