LLM2D

摘要

arXiv:2504.07097v1 宣告类型: cross 摘要: 在大规模语言模型（LLMs）中连续学习容易发生灾难性遗忘，即适应新任务会显著降低之前学习任务的表现。现有方法通常依赖于低秩、参数高效的更新，这限制了模型的表达能力，并为每个任务引入了额外的参数，导致可扩展性问题。为了解决这些限制，我们提出了一种新的连续全微调方法，利用自适应奇异值分解（SVD）。我们的方法动态地识别任务特定的低秩参数子空间，并约束更新与先前任务相关的关键方向正交，从而有效减少干扰，而不增加额外的参数开销或存储先前任务的梯度。我们使用编码器-解码器（T5-Large）和仅解码器（LLaMA-2 7B）模型在标准连续学习基准上广泛评估了我们的方法，这些任务包括分类、生成和推理。实验结果表明，我们的方法达到了最先进的效果，平均准确率比最近的基线方法如O-LoRA高出7%，并且在整个连续学习过程中，我们的方法有效地减少了遗忘，几乎可以忽略不计，从而保持了模型的通用语言能力、指令跟随准确性和安全性。我们的自适应SVD框架有效地平衡了模型的可塑性和知识的保留，为大规模语言模型中的连续学习场景提供了一种实用、理论支持且计算上可扩展的解决方案。