LLM2D
eFedLLM:基于联邦学习的高效大语言模型推理
eFedLLM: Efficient LLM Inference Based on Federated Learning
作者: Shengwen Ding, Chenhui Hu
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.16003v1

摘要

大型语言模型(LLM)开启了人工智能(AI)的变革时代。然而,LLM庞大的数据规模和参数量需要高要求的计算和内存资源,限制了其对更广泛用户和研究人员的可及性。本文介绍了一种有效的方法,提高了LLM推理的运行效率和经济性。通过利用基于Transformer的联邦学习(FL)和模型并行分布式训练,我们的模型有效地将计算负载和内存需求分配到参与者网络中。此策略允许用户,特别是资源有限的用户,协同训练最先进的LLM。我们还在FL框架内创新了一种激励机制,奖励建设性贡献并过滤恶意活动,从而保障训练过程的完整性和可靠性。同时,我们利用内存层次结构策略和权重矩阵上的奇异值分解(SVD)来进一步提高计算和内存效率。我们的结果源于公式分析和数值计算,证明了资源使用的显著优化,并使最先进的LLM能够被更广泛地访问,确保大规模用户都能为这些先进模型做出贡献并从中受益。