摘要
联邦学习 (FL) 为在移动边缘设备上训练机器学习模型提供了一个保护隐私的框架。传统的 FL 算法,例如 FedAvg,给这些设备带来了沉重的通信工作量。为了缓解这个问题,人们提出了分层联邦边缘学习 (HFEL),利用边缘服务器作为模型聚合的中介。尽管 HFEL 非常有效,但它遇到了诸如收敛速度慢和资源消耗高的问题,尤其是在存在系统和数据异构的情况下。然而,现有工作主要集中在提高传统 FL 的训练效率,而对 HFEL 的效率却鲜有研究。在本文中,我们考虑一个两层 HFEL 系统,其中边缘设备连接到边缘服务器,而边缘服务器通过点对点 (P2P) 边缘回程互连。我们的目标是通过战略性资源分配和拓扑设计来提高 HFEL 系统的训练效率。具体来说,我们制定了一个优化问题,通过分配计算和通信资源以及调整 P2P 连接来最小化总训练延迟。为了确保在动态拓扑下收敛,我们分析了收敛误差界限,并将模型一致性约束引入优化问题。然后将提出的问题分解成几个子问题,使我们能够在线地交替求解它。我们的方法促进了在数据和系统异构下边缘网络中大规模 FL 的有效实施。在基准数据集上的综合实验评估验证了所提方法的有效性,表明与各种基线相比,训练延迟显着降低,同时保持模型精度。