LLM2D
LoRA-Mini:自适应矩阵分解与选择性训练
LoRA-Mini : Adaptation Matrices Decomposition and Selective Training
作者: Ayush Singh, Rajdeep Aher, Shivank Garg
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.15804v1

摘要

大型语言模型 (LLM) 的快速发展彻底改变了自然语言处理,从而对高效的、特定任务的微调方法的需求日益增长。传统的 LLM 微调涉及更新大量参数,这在计算上代价高昂且内存密集。低秩自适应 (LoRA) 已成为一种很有前景的解决方案,通过减少可训练参数的数量来实现参数高效的微调。然而,虽然 LoRA 减少了可训练参数的数量,但 LoRA 模块仍然带来了巨大的存储挑战。我们提出了 LoRA-Mini,这是一种优化的 LoRA 自适应方法,它通过将低秩矩阵分成四个部分来提高参数效率,其中只有两个内部矩阵是可训练的。这种方法与标准 LoRA 相比,可训练参数的数量减少了高达 20 倍,同时保持了与标准 LoRA 相当的性能水平,解决了 LLM 微调中的计算效率和存储效率问题。