LLM2D

摘要

arXiv:2504.10168v1 放号类型: 横跨摘要：在本文中，我们提出了HalluSearch，这是一个多语言管道，旨在检测大型语言模型（LLM）输出中的伪造文本片段。作为Mu-SHROOM（多语言共享任务中的幻觉及相关过度生成错误）的一部分开发，HalluSearch 结合了检索增强验证与细粒度事实分割，以在十四种不同的语言中识别和定位幻觉。实证评估表明，HalluSearch 表现良好，在英语（前十名以内）和捷克语中分别排名第四个。虽然系统基于检索的方法在一般情况下证明是稳健的，但在在线覆盖有限的语言中却面临挑战，这突显了进一步研究的必要性，以确保在不同语言背景下的一致性幻觉检测。