LLM2D

摘要

arXiv:2502.00290v4 宣布类型: replace-cross 摘要：近年来，大型语言模型（LLMs）发展迅速，并在各种领域中得到了广泛应用。然而，LLMs 面临幻觉问题，当模型缺乏相关信息时，可能生成不可靠的回答。为了意识到潜在的幻觉，已经引入了不确定估计方法，并且大多数方法都确认可靠性在于关键令牌。然而，基于概率的方法在识别令牌可靠性方面表现不佳，限制了其实用性。在本文中，我们揭示了基于概率的方法由于在训练阶段丢失了证据强度信息，从而无法估计令牌可靠性。因此，我们提出了一种名为Logits-induced token uncertainty（LogTokU）的框架，用于估计LLMs中解耦的令牌不确定性，使得能够实时进行不确定性估计而无需进行多次采样过程。我们采用证据建模来实现LogTokU，并使用估计的不确定性来指导下游任务。实验结果表明，LogTokU具有显著的有效性和前景。