LLM2D

摘要

arXiv:2502.08109v1 交叉声明类型：cross 摘要：近期大规模语言模型（LLMs）的进步展示了令人 promising 的改进，常在自然语言处理领域的多种下游任务中超过现有方法。然而，这些模型仍然面临挑战，这些挑战可能妨碍它们的实际应用。例如，幻觉现象已知会损害LLMs的可靠性，特别是在要求高度事实精确度的领域。当前基准主要集中在幻觉检测和事实性评估，但并未扩展到超出识别的范围。本文提出了一种增强解释的幻觉检测模型，命名为HuDEx，旨在通过检测幻觉并提供详细解释来提高LLM生成响应的可靠性。所提出的模型提供了一种新的将检测与解释结合的方法，从而使用户和LLM本身能够理解并减少错误。我们的测量结果显示，所提出的模型在幻觉检测准确性方面超过了大型LLM，如Llama3 70B和GPT-4，同时保持可靠的解释。此外，所提出的模型在零-shot测试环境和其他测试环境中表现良好，展示了其在多样基准数据集上的适应性。所提出的方法进一步提高了幻觉检测研究，通过引入一种将可解释性与幻觉检测结合的新方法，进一步提高了语言模型中评估幻觉的性能和可靠性。