LLM2D

摘要

arXiv:2502.11513v1 宣告类型: cross 摘要: 大型语言模型在各种任务中展现了卓越的能力，但它们的微调需要大量的内存，这在资源受限的环境中构成了挑战。零阶（ZO）优化提供了一种内存高效的替代方案，因为它消除了反向传播的需求。然而，ZO优化存在梯度方差高的问题，之前的研究主要集中在单任务学习上，而对多任务学习的应用则鲜有涉及。多任务学习对于利用任务间的共享知识以提高泛化能力至关重要，但在ZO设置下它也带来了独特的挑战，比如梯度方差放大和共线性。本文介绍了MaZO，这是首个专为ZO优化环境下多任务LLM微调设计的框架。MaZO通过两个关键创新从参数层面解决这些挑战：一个权重重要性度量来识别关键参数，以及一个多任务权重更新掩码来选择性地更新这些参数，从而减少参数空间的维度并缓解任务冲突。实验结果表明，MaZO达到了最先进的性能，甚至超越了为一阶优化设计的多任务学习方法。