摘要
arXiv:2502.08109v1 交叉声明类型:cross
摘要:近期大规模语言模型(LLMs)的进步展示了令人 promising 的改进,常在自然语言处理领域的多种下游任务中超过现有方法。然而,这些模型仍然面临挑战,这些挑战可能妨碍它们的实际应用。例如,幻觉现象已知会损害LLMs的可靠性,特别是在要求高度事实精确度的领域。当前基准主要集中在幻觉检测和事实性评估,但并未扩展到超出识别的范围。本文提出了一种增强解释的幻觉检测模型,命名为HuDEx,旨在通过检测幻觉并提供详细解释来提高LLM生成响应的可靠性。所提出的模型提供了一种新的将检测与解释结合的方法,从而使用户和LLM本身能够理解并减少错误。我们的测量结果显示,所提出的模型在幻觉检测准确性方面超过了大型LLM,如Llama3 70B和GPT-4,同时保持可靠的解释。此外,所提出的模型在零-shot测试环境和其他测试环境中表现良好,展示了其在多样基准数据集上的适应性。所提出的方法进一步提高了幻觉检测研究,通过引入一种将可解释性与幻觉检测结合的新方法,进一步提高了语言模型中评估幻觉的性能和可靠性。