LLM2D

摘要

arXiv:2501.09997v2 声明类型: replace-cross 摘要：幻觉已成为大型语言模型（LLMs）有效应用的重要障碍。在本文中，我们提出了一种新型的注意力引导自我反思（AGSER）方法，用于LLMs中的零样本幻觉检测。AGSER方法利用注意力贡献将输入查询分为关注和非关注查询。然后，每个查询分别通过LLMs处理，使我们能够计算生成响应与原始答案之间的一致性分数。两个一致性分数之间的差异作为幻觉估计器。除了在检测幻觉方面的有效性外，AGSER还显著减少了计算开销，只需通过LLM三遍处理，并使用两组令牌。我们使用四个广泛使用的LLMs在三个不同的幻觉基准上进行了广泛的实验，结果表明，我们的方法在零样本幻觉检测中的表现远优于现有方法。