LLM2D
HalluSearch 在 SemEval-2025 任务 3 中:一种增强搜索的 RAG 管道用于幻觉检测
HalluSearch at SemEval-2025 Task 3: A Search-Enhanced RAG Pipeline for Hallucination Detection
作者: Mohamed A. Abdallah, Samhaa R. El-Beltagy
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.10168v1

摘要

arXiv:2504.10168v1 放号类型: 横跨 摘要:在本文中,我们提出了HalluSearch,这是一个多语言管道,旨在检测大型语言模型(LLM)输出中的伪造文本片段。作为Mu-SHROOM(多语言共享任务中的幻觉及相关过度生成错误)的一部分开发,HalluSearch 结合了检索增强验证与细粒度事实分割,以在十四种不同的语言中识别和定位幻觉。实证评估表明,HalluSearch 表现良好,在英语(前十名以内)和捷克语中分别排名第四个。虽然系统基于检索的方法在一般情况下证明是稳健的,但在在线覆盖有限的语言中却面临挑战,这突显了进一步研究的必要性,以确保在不同语言背景下的一致性幻觉检测。