LLM2D

摘要

联邦学习 (FL) 为在移动边缘设备上训练机器学习模型提供了一个保护隐私的框架。传统的 FL 算法，例如 FedAvg，给这些设备带来了沉重的通信工作量。为了缓解这个问题，人们提出了分层联邦边缘学习 (HFEL)，利用边缘服务器作为模型聚合的中介。尽管 HFEL 非常有效，但它遇到了诸如收敛速度慢和资源消耗高的问题，尤其是在存在系统和数据异构的情况下。然而，现有工作主要集中在提高传统 FL 的训练效率，而对 HFEL 的效率却鲜有研究。在本文中，我们考虑一个两层 HFEL 系统，其中边缘设备连接到边缘服务器，而边缘服务器通过点对点 (P2P) 边缘回程互连。我们的目标是通过战略性资源分配和拓扑设计来提高 HFEL 系统的训练效率。具体来说，我们制定了一个优化问题，通过分配计算和通信资源以及调整 P2P 连接来最小化总训练延迟。为了确保在动态拓扑下收敛，我们分析了收敛误差界限，并将模型一致性约束引入优化问题。然后将提出的问题分解成几个子问题，使我们能够在线地交替求解它。我们的方法促进了在数据和系统异构下边缘网络中大规模 FL 的有效实施。在基准数据集上的综合实验评估验证了所提方法的有效性，表明与各种基线相比，训练延迟显着降低，同时保持模型精度。