摘要
arXiv:2501.09997v2 声明类型: replace-cross
摘要:幻觉已成为大型语言模型(LLMs)有效应用的重要障碍。在本文中,我们提出了一种新型的注意力引导自我反思(AGSER)方法,用于LLMs中的零样本幻觉检测。AGSER方法利用注意力贡献将输入查询分为关注和非关注查询。然后,每个查询分别通过LLMs处理,使我们能够计算生成响应与原始答案之间的一致性分数。两个一致性分数之间的差异作为幻觉估计器。除了在检测幻觉方面的有效性外,AGSER还显著减少了计算开销,只需通过LLM三遍处理,并使用两组令牌。我们使用四个广泛使用的LLMs在三个不同的幻觉基准上进行了广泛的实验,结果表明,我们的方法在零样本幻觉检测中的表现远优于现有方法。