LLM2D

摘要

低秩适应 (LoRA) 是一种流行的参数高效微调 (PEFT) 方法，它可以有效地适应大型预训练模型以用于下游任务。LoRA 使用每层低秩矩阵参数化模型更新，显著减少了可训练参数的数量，从而在微调期间降低了资源需求。然而，由于使用了低秩矩阵模型，可训练参数数量的下限仍然很高。在本文中，我们通过提出一种新的方法来解决这一限制，该方法采用低秩张量参数化模型更新。所提出的低秩张量模型可以显著减少可训练参数的数量，同时还可以更细粒度地控制适配器的大小。我们在自然语言理解、指令微调、偏好优化和蛋白质折叠基准上的实验表明，我们的方法在微调大型语言模型方面既高效又有效，在保持相当性能的同时，显著减少了参数数量。