LLM2D

摘要

本文介绍了一种名为标准基LoRA（SBoRA）的新型参数高效微调方法，用于大型语言模型，该方法建立在低秩自适应（LoRA）和正交自适应的开创性工作的基础上。SBoRA将可训练参数的数量减少一半，或者在与LoRA相同数量的可训练参数下将秩加倍，同时提高学习性能。通过利用正交标准基向量来初始化一个低秩矩阵（$\mathbf{A}$或$\mathbf{B}$），SBoRA促进了区域权重更新和内存高效的微调。这产生了两种变体，SBoRA-FA和SBoRA-FB，其中只有一个矩阵被更新，导致稀疏更新矩阵$\mathrm{\Delta} \mathbf{W}$主要包含零行或零列。因此，大多数微调模型的权重$(\mathbf{W}_0+\mathrm{\Delta} \mathbf{W})$与预训练权重保持不变，类似于人脑的模块化组织，可以有效地适应新任务。我们的实证结果表明，在各种微调任务（包括常识推理和算术推理）中，SBoRA-FA优于LoRA。此外，我们评估了QSBoRA在不同规模的量化LLaMA模型上的有效性，突出了其高效适应新任务的潜力。代码可在https://github.com/cityuhkai/SBoRA获取。