LLM2D

摘要

arXiv:2505.02795v1 宣布类型: 综合摘要：近年来，大规模语言模型（LLMs）取得了显著突破，革新了自然语言处理领域以及更广泛的领域。由于参数规模庞大，使用私有数据对这些模型进行微调以适应多种下游任务已成为主流。虽然联邦学习（FL）为在不共享原始数据的情况下微调LLMs提供了一种有前景的解决方案，但重大的计算成本阻碍了其普及。此外，在现实世界中，私有客户端设备往往拥有不同的计算资源，这进一步复杂了LLM微调的问题。为应对这些挑战，我们提出了一种基于拆分学习（SL）和低秩适应（LoRA）微调的异构参数高效微调（PEFT）框架——HSplitLoRA，用于在异构客户端设备上高效微调LLMs。HSplitLoRA 首先根据权重对LLM训练的贡献识别出重要权重。然后，它会根据所选权重的不同计算预算动态配置LoRA适配器的分解秩，并根据客户端设备不同的计算预算确定模型分割点。最后，设计了一种无噪声的适配器聚合机制，支持异构适配器聚合而不引入噪声。广泛的实验证明，HSplitLoRA 在训练准确性和收敛速度方面超越了现有基准。