摘要
作为文本理解和生成的现代首选工具,大型语言模型 (LLM) 预计能够通过利用输入上下文准确地输出答案。这要求 LLM 同时具备上下文忠实度和事实准确性。为了通过事实增强方法减轻幻觉,人们付出了大量努力来使 LLM 能够产生更好的输出。然而,它们也存在阻碍上下文忠实度的风险,因为事实增强会导致 LLM 对其参数化知识过于自信,从而忽略相关的输入上下文。在这项工作中,我们认为当前的事实增强方法会严重损害 LLM 的上下文忠实度。我们首先回顾了当前的事实增强方法,并评估了它们在增强事实准确性方面的有效性。接下来,我们评估了它们在知识编辑任务上的表现,以评估对上下文忠实度的潜在影响。实验结果表明,虽然这些方法可能在事实准确性方面产生不一致的改进,但它们也会导致上下文忠实度更严重的下降,最大下降幅度高达惊人的 69.7%。为了解释这些下降,我们分析了分别代表新知识和参数化知识的标记的隐藏状态和 logits 分布,突出了当前方法的局限性。我们的发现突出了增强 LLM 所固有的复杂权衡。因此,我们建议更多关于 LLM 事实增强的研究应努力减少对上下文忠实度的牺牲。