LLM2D
通过交替优化LoRA实现稳健的联邦微调大规模语言模型
Robust Federated Finetuning of LLMs via Alternating Optimization of LoRA
作者: Shuangyi Chen, Yuanxin Guo, Yue Ju, Harik Dalal, Ashish Khisti
发布日期: 2/5/2025
arXiv ID: 2502.01755

摘要

arXiv:2502.01755v1 交叉公告类型 摘要:参数高效微调(PEFT)方法如LoRA低秩适应通过减少计算和通信成本来优化联邦训练。我们提出了RoLoRA,这是一种使用交替优化来微调LoRA适配器的联邦框架。我们的方法强调了学习上投影和下投影矩阵的重要性,以增强表达能力和鲁棒性。我们通过理论分析和大量的实验展示了RoLoRA相较于其他方法的优势,这些方法要么生成不完美的模型更新,要么限制模型的表达能力。我们通过对简化线性模型的理论分析展示了在LoRA中学习下投影和上投影矩阵的重要性。我们还在MNIST上的小型神经网络和罗伯塔-大型、Llama-2-7B等大型语言模型上进行了广泛的实验评估,展示了RoLoRA相较于其他方法的优势。