LLM2D

摘要

arXiv:2502.08577v1 交叉公告类型：跨领域摘要：近年来，联邦学习（FL）已经成为在高度隐私关切领域训练机器学习模型的一种流行解决方案。然而，在实际部署中，当设备之间的数据分布为非独立非同分布（non-IID）时，FL的可扩展性和性能面临着显著的挑战。数据分布的异质性通常源于设备的空间分布，这在没有适当处理的情况下会导致模型性能下降。此外，联邦学习典型依赖于集中式架构，这在大规模应用或动态环境中带来了瓶颈和单点故障的风险。为填补这一空白，我们提出了一种基于场的联邦学习（FBFL），这是一种利用宏编程和场协调的新颖方法，通过以下方式解决这些限制：（i）分布式的基于空间的领导者选举，以减轻非-IID数据挑战；（ii）使用先进的宏编程模式构建一个自我组织的分层架构。此外，FBFL不仅克服了上述限制，还使开发专门针对每个子区域数据分布的模型成为可能。本文对FBFL进行了形式化定义，并使用MNIST、FashionMNIST和扩展的MNIST数据集进行了广泛评估。我们证明，在IID数据条件下，FBFL的表现与广泛使用的FedAvg算法相当。此外，在具有挑战性的非-IID场景中，FBFL不仅优于FedAvg，还超越了专门设计用于应对非-IID数据分布的其他最先进的方法，如FedProx和Scaffold。此外，我们展示了FBFL自组织分层架构对服务器故障的抗御能力。