LLM2D
基于量子启发适配器的超压缩大型基础模型微调
Hyper Compressed Fine-Tuning of Large Foundation Models with Quantum Inspired Adapters
作者: Snehal Raj, Brian Coyle
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.06916v1

摘要

arXiv:2502.06916v1 类别: cross 摘要: 由于全参数更新相关的计算和存储需求,对预训练大型基础模型进行特定任务的微调变得越来越具有挑战性。参数高效微调(PEFT)方法通过使用适配器模块只更新模型的小部分参数来解决这一问题。在这项工作中,我们提出了启发于量子机器学习文献中保持汉明权重的量子电路的“量子启发式适配器”PEFT方法。这些模型可以在一个组合上巨大的空间中操作,同时保留权重参数的正交性,从而既具有表达能力又具有参数效率。我们通过在基准数据集上适应大型语言模型和大型视觉变换器来测试我们提出的手法。我们的方法在GLUE和VTAB等语言理解数据集上的性能达到了现有微调方法(如LoRA)的99.2%,参数压缩比达到了44倍。与现有的正交微调方法(如OFT或BOFT)相比,我们在参数数量减少25倍的情况下实现了98%的相对性能。这表明该方法在确保了较高性能的同时,还显著减少了可训练参数的数量。通过消融研究,我们发现结合不同的汉明权重顺序、正交性和矩阵复合对于高性能微调是必不可少的。我们的研究结果表明,量子启发式适配器为资源受限环境中语言和视觉模型的有效适配提供了有前途的方向。