LLM2D

摘要

大型语言模型（LLM）开启了人工智能（AI）的变革时代。然而，LLM庞大的数据规模和参数量需要高要求的计算和内存资源，限制了其对更广泛用户和研究人员的可及性。本文介绍了一种有效的方法，提高了LLM推理的运行效率和经济性。通过利用基于Transformer的联邦学习（FL）和模型并行分布式训练，我们的模型有效地将计算负载和内存需求分配到参与者网络中。此策略允许用户，特别是资源有限的用户，协同训练最先进的LLM。我们还在FL框架内创新了一种激励机制，奖励建设性贡献并过滤恶意活动，从而保障训练过程的完整性和可靠性。同时，我们利用内存层次结构策略和权重矩阵上的奇异值分解（SVD）来进一步提高计算和内存效率。我们的结果源于公式分析和数值计算，证明了资源使用的显著优化，并使最先进的LLM能够被更广泛地访问，确保大规模用户都能为这些先进模型做出贡献并从中受益。