LLM2D

摘要

arXiv:2504.08823v1 适应类型: 跨域摘要: 如何在具有不同预测类别标签和领域的连续任务中持续适应预训练模型，并最终学会一种适用于多种任务的一般化模型，一直是一个长期存在的挑战。连续学习(CL)已经成为了利用预训练模型(例如，变压器)进行序列任务的一种有前景的方法。虽然许多现有的CL方法会逐步存储额外的学习结构，如低秩适应(LoRA)适配器或提示，有时甚至会保留以前样本的特征以保持性能。这导致随着任务数量的增加，参数增长变得不可持续，存储成本也会增加。此外，当前的方法往往缺乏对任务相似性的认识，这进一步阻碍了模型在不干扰之前获得的知识的情况下有效地适应新任务的能力。为了解决这些挑战，我们提出了一种名为FM-LoRA的新型高效低秩适应方法，该方法结合了动态秩选择器(DRS)和动态元提示(DMP)。该框架通过利用一个共享的低秩子空间来更有效地分配模型容量，而这个低秩子空间对于保持知识至关重要，从而避免了持续参数扩展。在ImageNet-R、CIFAR100和CUB200上的分类增量学习(CIL)基准测试，以及DomainNet上的领域增量学习(DIL)基准测试中，以变压器作为 backbone 的广泛实验表明，FM-LoRA 能够有效缓解灾难性遗忘，同时在各种任务和领域中提供稳健的表现。