LLM2D

摘要

arXiv:2502.12346v1 宣布类型: cross 摘要: 语言模型（LLMs）通常被量化为较低的精度，以降低推理时的内存成本和延迟。然而，量化往往会导致模型性能下降，因此需要对各种下游任务进行微调。传统的微调方法，如随机梯度下降和Adam优化，需要反向传播，这在低精度设置中容易出错。为了解决这些限制，我们提出了Quantized Zeroth-Order（QuZO）框架，专门用于通过低精度（例如4位或8位）前向传递来微调LLMs。我们的方法可以避开低精度下的易出错的直通过滤器估计，并利用优化的随机舍入来减轻增加的偏差。QuZO简化了训练过程，同时在${\rm FP}8$中达到与一阶方法可对比的结果，在${\rm INT}8$和${\rm INT}4$训练中则表现出更高的准确性。实验结果表明，低比特训练的QuZO在GLUE、多选择和生成任务上达到了与MeZO优化方法可比的性能，在对LLaMA2-7B的微调中，与量化的一阶方法相比，内存成本降低了$2.94 \times$。