LLM2D
长上下文幻觉检测
Towards Long Context Hallucination Detection
作者: Siyi Liu, Kishaloy Halder, Zheng Qi, Wei Xiao, Nikolaos Pappas, Phu Mon Htut, Neha Anna John, Yassine Benajiba, Dan Roth
发布日期: 4/29/2025
arXiv ID: oai:arXiv.org:2504.19457v1

摘要

arXiv:2504.19457v1 类型: cross 摘要:大规模语言模型(LLMs)在各种任务中展现了卓越的表现。然而,它们容易出现情境幻觉(contextual hallucination),生成与给定情境无关或自相矛盾的信息。尽管许多研究已经探讨了LLMs中的情境幻觉,但在处理长上下文输入方面的问题仍是一个开放性问题。在这项工作中,我们首先通过构建一个专门用于长上下文幻觉检测的数据集,迈出了解决这一问题的第一步。此外,我们提出了一种新颖的架构,使预训练的编码器模型(如BERT)能够处理长上下文,并通过分解和聚合机制有效地检测情境幻觉。我们的实验结果表明,所提出的架构在各种指标上显著优于相同规模的先前模型以及基于LLM的模型,同时还提供了显著更快的推理速度。