摘要
arXiv:2502.00089v1 Announce Type: cross
摘要:大型语言模型(LLMs)的训练和微调通常涉及来自多个来源的多样化的文本数据,这会导致方向相反的梯度,阻碍优化和专业化,从而影响模型在不同任务上的泛化能力,导致下游性能降低。最近的研究表明,通过在精心选择的任务特定子集上微调LLMs,可以达到甚至超过使用整个数据集的效果。基于这些发现,我们提出了一种低秩专家适配器的集合(ELREA)框架,以提高模型处理多样化任务的能力。ELREA根据梯度方向对训练指令进行聚类,表示不同的专业领域,并减少优化过程中的冲突。然后在这些聚类上训练专家适配器,利用低秩适应(LoRA)技术确保训练效率和模型的可扩展性。在推理过程中,ELREA基于输入数据与训练聚类的梯度相似性,结合最相关的专家适配器的预测,确保为每个任务选择最优的适配器。实验表明,我们的方法在多种领域特定任务上优于基础的LoRA适配器以及具有相似训练和推理复杂性的其他集成方法。