LLM2D

摘要

arXiv:2502.00290v1 类型: cross 摘要：近年来，大型语言模型（LLMs）取得了显著的进步，并被广泛集成到各个领域中。尽管取得了这些进展，但LLMs容易产生幻觉，即生成的响应可能不可靠，尤其是在模型缺乏足够的依托知识时。为了缓解这一问题，已经采用了估计不确定性的方法，重点是关键标记作为可靠性的指示器。然而，基于概率的方法在评估标记级可靠性方面存在局限性，因为它们无法保留训练过程中获得的证据强度信息。在本文中，我们提出了Logits诱导的标记不确定性（LogU），这是一种新颖的框架，用于在无需多次采样即可实时估计LLMs中的标记特定不确定性。通过利用证据建模来实施LogU，我们使用得出的不确定性度量来指导下游任务。我们的实验结果突显了LogU的显著效果和潜力，标志着在应对模型幻觉挑战方面取得了重大进展。