LLM2D
BLoB:基于反向传播的大语言模型贝叶斯低秩自适应
BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models
作者: Yibin Wang, Haizhou Shi, Ligong Han, Dimitris Metaxas, Hao Wang
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2406.11675v3

摘要

大型语言模型 (LLMs) 在推理过程中经常表现出过度自信,尤其是在适应数据有限的下游领域特定任务时。先前的工作通过在 LLM 训练完成后采用近似贝叶斯估计来解决这个问题,使它们能够量化不确定性。然而,这种训练后方法的性能受到训练过程中学习的参数的严重限制。在本文中,我们超越了训练后贝叶斯化,提出了通过反向传播的贝叶斯低秩自适应 (BLoB) 算法,该算法在整个微调过程中连续且联合地调整 LLM 参数的均值和协方差。我们的实证结果验证了 BLoB 在泛化和不确定性估计方面的有效性,在分布内和分布外数据上进行评估。