LLM2D
面向注意力的自我反思在大规模语言模型中的零样本幻觉检测
Attention-guided Self-reflection for Zero-shot Hallucination Detection in Large Language Models
作者: Qiang Liu, Xinlong Chen, Yue Ding, Shizhen Xu, Shu Wu, Liang Wang
发布日期: 2/13/2025
arXiv ID: oai:arXiv.org:2501.09997v2

摘要

arXiv:2501.09997v2 声明类型: replace-cross 摘要:幻觉已成为大型语言模型(LLMs)有效应用的重要障碍。在本文中,我们提出了一种新型的注意力引导自我反思(AGSER)方法,用于LLMs中的零样本幻觉检测。AGSER方法利用注意力贡献将输入查询分为关注和非关注查询。然后,每个查询分别通过LLMs处理,使我们能够计算生成响应与原始答案之间的一致性分数。两个一致性分数之间的差异作为幻觉估计器。除了在检测幻觉方面的有效性外,AGSER还显著减少了计算开销,只需通过LLM三遍处理,并使用两组令牌。我们使用四个广泛使用的LLMs在三个不同的幻觉基准上进行了广泛的实验,结果表明,我们的方法在零样本幻觉检测中的表现远优于现有方法。