LLM2D

摘要

arXiv:2502.00089v1 Announce Type: cross 摘要：大型语言模型（LLMs）的训练和微调通常涉及来自多个来源的多样化的文本数据，这会导致方向相反的梯度，阻碍优化和专业化，从而影响模型在不同任务上的泛化能力，导致下游性能降低。最近的研究表明，通过在精心选择的任务特定子集上微调LLMs，可以达到甚至超过使用整个数据集的效果。基于这些发现，我们提出了一种低秩专家适配器的集合（ELREA）框架，以提高模型处理多样化任务的能力。ELREA根据梯度方向对训练指令进行聚类，表示不同的专业领域，并减少优化过程中的冲突。然后在这些聚类上训练专家适配器，利用低秩适应（LoRA）技术确保训练效率和模型的可扩展性。在推理过程中，ELREA基于输入数据与训练聚类的梯度相似性，结合最相关的专家适配器的预测，确保为每个任务选择最优的适配器。实验表明，我们的方法在多种领域特定任务上优于基础的LoRA适配器以及具有相似训练和推理复杂性的其他集成方法。