LLM2D
基于注意力图上的拓扑发散检测大模型的幻觉检测
Hallucination Detection in LLMs via Topological Divergence on Attention Graphs
作者: Alexandra Bazarova, Aleksandr Yugay, Andrey Shulga, Alina Ermilova, Andrei Volodichev, Konstantin Polev, Julia Belikova, Rauf Parchiev, Dmitry Simakov, Maxim Savchenko, Andrey Savchenko, Serguei Barannikov, Alexey Zaytsev
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.10063v1

摘要

arXiv:2504.10063v1 Announce Type: cross 摘要:幻觉,即生成事实错误的内容,仍然是大型语言模型(LLMs)面临的重大挑战。我们提出了TOHA,一种在RAG设置下的基于拓扑的幻觉检测器,利用拓扑发散度度量来量化由注意矩阵诱导的图形的结构性质。通过检查提示子图和响应子图之间的拓扑发散度,可以发现一致的模式:特定注意头的更高发散值与幻觉输出相关联,这与数据集无关。广泛的实验,包括在问答任务和数据到文本任务上的评估,表明我们的方法在多个基准上取得了最先进的或竞争力的结果,其中两个基准是由我们标注并公开发布的,以促进进一步的研究。除了其在领域内的强大表现外,TOHA 在多个开源LLMs之间的领域应用保持了显著的可转移性。我们的研究发现表明,分析注意矩阵的拓扑结构可以作为一种高效且稳健的事实可靠性指标,在LLMs中具有应用价值。