LLM2D
使用Logits估计LLM不确定性
Estimating LLM Uncertainty with Logits
作者: Huan Ma, Jingdong Chen, Guangyu Wang, Changqing Zhang
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2502.00290v1

摘要

arXiv:2502.00290v1 类型: cross 摘要:近年来,大型语言模型(LLMs)取得了显著的进步,并被广泛集成到各个领域中。尽管取得了这些进展,但LLMs容易产生幻觉,即生成的响应可能不可靠,尤其是在模型缺乏足够的依托知识时。为了缓解这一问题,已经采用了估计不确定性的方法,重点是关键标记作为可靠性的指示器。然而,基于概率的方法在评估标记级可靠性方面存在局限性,因为它们无法保留训练过程中获得的证据强度信息。在本文中,我们提出了Logits诱导的标记不确定性(LogU),这是一种新颖的框架,用于在无需多次采样即可实时估计LLMs中的标记特定不确定性。通过利用证据建模来实施LogU,我们使用得出的不确定性度量来指导下游任务。我们的实验结果突显了LogU的显著效果和潜力,标志着在应对模型幻觉挑战方面取得了重大进展。