LLM2D

摘要

arXiv:2408.17383v2 宣告类型: replace-cross 摘要: 参数高效微调（PEFT）技术解锁了经济地和容易地专门化大型预训练模型的潜力。然而，最突出的方法，如低秩适配器（LoRA），依赖于其架构选择中的启发式或常规做法——这可能会限制它们在新模型和架构上的性能。这一局限性表明，可以从神经架构搜索技术中获得最优适配器架构，但这些技术通常成本高昂且难以实现。我们通过Monarch矩形微调（MoRe）解决了这一挑战，MoRe是一种基于Monarch矩阵类的简单框架，用于搜索适配器架构。理论上，我们证明了MoRe比LoRA更具表现力。实证上，与当前最先进的PEFT技术相比，我们的方法在一系列任务和模型上更具有参数高效性和性能，仅使用LoRA参数的5%即可。