摘要
arXiv:2505.08325v1 宣告类型:交叉
摘要:遥感(RS)图像通常以史无前例的规模生成,但它们在地理上和机构上分布广泛,由于数据共享限制和隐私问题,中央模型训练颇具挑战性。联邦学习(FL)提供了一种解决方案,通过在去中心化的RS数据源之间进行协作模型训练而不暴露原始数据。然而,在RS中缺乏一个现实的联邦数据集和基准。先前的工作通常依赖于手动分割的单个数据集,未能捕捉到现实世界RS数据的异质性和规模,并且经常使用不一致的实验设置,阻碍了公平比较。为弥补这一差距,我们提出了一种现实的联邦RS数据集,称为FedRS。FedRS由涵盖各种传感器和分辨率的八个数据集组成,并构建了135个客户端,这代表了现实操作场景。每个客户端的数据来自同一来源,表现出真实的联邦属性,如标签分布偏差、客户端数据量失衡以及客户端之间的领域异质性。这些特征反映了联邦RS中实际面临的挑战,并支持对FL方法进行大规模评估。基于FedRS,我们实现了10种基线FL算法和评估指标,以构建全面的FedRS-Bench。实验结果表明,FL可以在孤立数据孤岛训练中一致地提高模型性能,同时在不同客户端异质性和可用性条件下揭示不同方法的性能权衡。我们希望FedRS-Bench可以通过提供标准化、丰富的测试环境并促进未来工作之间的公平比较,加速对大规模、现实FL在RS中的研究。源代码和数据集可在https://fedrs-bench.github.io/获得。