LLM2D

摘要

低秩自适应（LoRA）通过冻结原始权重并仅训练低秩矩阵，在训练方面取得了显著成果，成为LLM的主要微调方法。为了追求更接近全参数训练的性能，一系列LoRA变体应运而生，例如LoRA+、PISSA、Olora和LoRA-GA。然而，这些改进使模型训练的初始设置更加复杂，并增加了初始化时间。更重要的是，它们忽略了原始权重信息的内部交互。为了解决这些问题，我们引入了一种新的理论，“权重引导”，旨在训练过程中通过原始权重持续引导可训练矩阵，以增强权重信息的利用率。基于此理论，我们设计了一种新的PEFT技术，称为Bone（**B**l**o**ck Affi**ne**），它不仅增强了原始权重信息的利用率，而且强调了权重之间的内部联系，从而实现更快的收敛和更好的数据拟合。跨两种不同LLM架构（LLaMA2、RWKV6）和各种参数规模的实验比较表明，Bone结构可以实现快速收敛和优越的数据拟合，而无需复杂的初始化。例如，当在MetaMathQA数据集上微调LLaMA2-7B并在GSM8k和数学基准上进行验证时，Bone分别获得了49.36和8.8的微调分数，分别比PISSA高出5.84%和1.96%。