LLM2D
雕塑子空间:受限全面微调在LLMs中的连续学习中应用
Sculpting Subspaces: Constrained Full Fine-Tuning in LLMs for Continual Learning
作者: Nikhil Shivakumar Nayak, Krishnateja Killamsetty, Ligong Han, Abhishek Bhandwaldar, Prateek Chanda, Kai Xu, Hao Wang, Aldo Pareja, Oleg Silkin, Mustafa Eyceoz, Akash Srivastava
发布日期: 4/10/2025
arXiv ID: oai:arXiv.org:2504.07097v1

摘要

arXiv:2504.07097v1 宣告类型: cross 摘要: 在大规模语言模型(LLMs)中连续学习容易发生灾难性遗忘,即适应新任务会显著降低之前学习任务的表现。现有方法通常依赖于低秩、参数高效的更新,这限制了模型的表达能力,并为每个任务引入了额外的参数,导致可扩展性问题。为了解决这些限制,我们提出了一种新的连续全微调方法,利用自适应奇异值分解(SVD)。我们的方法动态地识别任务特定的低秩参数子空间,并约束更新与先前任务相关的关键方向正交,从而有效减少干扰,而不增加额外的参数开销或存储先前任务的梯度。我们使用编码器-解码器(T5-Large)和仅解码器(LLaMA-2 7B)模型在标准连续学习基准上广泛评估了我们的方法,这些任务包括分类、生成和推理。实验结果表明,我们的方法达到了最先进的效果,平均准确率比最近的基线方法如O-LoRA高出7%,并且在整个连续学习过程中,我们的方法有效地减少了遗忘,几乎可以忽略不计,从而保持了模型的通用语言能力、指令跟随准确性和安全性。我们的自适应SVD框架有效地平衡了模型的可塑性和知识的保留,为大规模语言模型中的连续学习场景提供了一种实用、理论支持且计算上可扩展的解决方案。