LLM2D

摘要

arXiv:2505.08325v1 宣告类型：交叉摘要：遥感（RS）图像通常以史无前例的规模生成，但它们在地理上和机构上分布广泛，由于数据共享限制和隐私问题，中央模型训练颇具挑战性。联邦学习（FL）提供了一种解决方案，通过在去中心化的RS数据源之间进行协作模型训练而不暴露原始数据。然而，在RS中缺乏一个现实的联邦数据集和基准。先前的工作通常依赖于手动分割的单个数据集，未能捕捉到现实世界RS数据的异质性和规模，并且经常使用不一致的实验设置，阻碍了公平比较。为弥补这一差距，我们提出了一种现实的联邦RS数据集，称为FedRS。FedRS由涵盖各种传感器和分辨率的八个数据集组成，并构建了135个客户端，这代表了现实操作场景。每个客户端的数据来自同一来源，表现出真实的联邦属性，如标签分布偏差、客户端数据量失衡以及客户端之间的领域异质性。这些特征反映了联邦RS中实际面临的挑战，并支持对FL方法进行大规模评估。基于FedRS，我们实现了10种基线FL算法和评估指标，以构建全面的FedRS-Bench。实验结果表明，FL可以在孤立数据孤岛训练中一致地提高模型性能，同时在不同客户端异质性和可用性条件下揭示不同方法的性能权衡。我们希望FedRS-Bench可以通过提供标准化、丰富的测试环境并促进未来工作之间的公平比较，加速对大规模、现实FL在RS中的研究。源代码和数据集可在https://fedrs-bench.github.io/获得。