LLM2D

摘要

作为文本理解和生成的现代首选工具，大型语言模型 (LLM) 预计能够通过利用输入上下文准确地输出答案。这要求 LLM 同时具备上下文忠实度和事实准确性。为了通过事实增强方法减轻幻觉，人们付出了大量努力来使 LLM 能够产生更好的输出。然而，它们也存在阻碍上下文忠实度的风险，因为事实增强会导致 LLM 对其参数化知识过于自信，从而忽略相关的输入上下文。在这项工作中，我们认为当前的事实增强方法会严重损害 LLM 的上下文忠实度。我们首先回顾了当前的事实增强方法，并评估了它们在增强事实准确性方面的有效性。接下来，我们评估了它们在知识编辑任务上的表现，以评估对上下文忠实度的潜在影响。实验结果表明，虽然这些方法可能在事实准确性方面产生不一致的改进，但它们也会导致上下文忠实度更严重的下降，最大下降幅度高达惊人的 69.7%。为了解释这些下降，我们分析了分别代表新知识和参数化知识的标记的隐藏状态和 logits 分布，突出了当前方法的局限性。我们的发现突出了增强 LLM 所固有的复杂权衡。因此，我们建议更多关于 LLM 事实增强的研究应努力减少对上下文忠实度的牺牲。