LLM2D
IterIS: 迭代推理-求解对齐 для LoRA 融合
IterIS: Iterative Inference-Solving Alignment for LoRA Merging
作者: Hongxu Chen, Runshi Li, Bowei Zhu, Zhen Wang, Long Chen
发布日期: 4/16/2025
arXiv ID: oai:arXiv.org:2411.15231v2

摘要

arXiv:2411.15231v2 宣布类型: replace-cross 摘要:低秩适应(LoRA)广泛用于跨各种领域对大型模型进行微调,以适应特定的下游任务。虽然特定任务的LoRA通常可用,但关于数据隐私和知识产权的担忧会限制访问训练数据,从而限制通过梯度训练获得多任务模型的机会。为应对这一挑战,LoRA合并提供了一种有效解决方案,即通过结合多个LoRA进入一个统一的适配器,同时保持数据隐私。先前关于LoRA合并的工作主要将其框架化为一个优化问题,但这些方法面临一些限制,包括优化中粗糙的输入特征假设、庞大的样本需求以及目标函数的不平衡性。这些限制可能会显著降低性能。为解决这些问题,我们提出了一种新的基于优化的方法,名为IterIS:1)我们将LoRA合并形式化为一个先进的优化问题,以缓解粗糙的输入特征假设。此外,我们在算法中采用了迭代推理求解框架,可以逐步细化优化目标以提高性能。2)我们引入了一种高效的正则化项,以减少庞大的样本需求(与先前方法相比,仅需要1-5%的无标签样本)。3)我们在优化目标中使用自适应权重,以缓解LoRA合并过程中的潜在不平衡性。我们的方法在文本到图像扩散任务、视觉语言模型和大型语言模型的组成任务方面,在多个基准和最先进的方法上显示出显著的性能提高。此外,我们的逐层算法可以通过极少量的步骤达到收敛,确保在内存和计算上都具有高效性。