LLM2D
检索、重思和修正:验证链可以改进检索增强生成
Retrieving, Rethinking and Revising: The Chain-of-Verification Can Improve Retrieval Augmented Generation
作者: Bolei He, Nuo Chen, Xinran He, Lingyong Yan, Zhenkai Wei, Jinchang Luo, Zhen-Hua Ling
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2410.05801v1

摘要

近年来,检索增强生成 (RAG) 旨在通过整合从外部来源检索到的海量知识来增强大型语言模型 (LLM)。然而,这种方法面临着一些挑战:首先,原始查询可能不适合精确检索,导致上下文知识错误;其次,由于知识边界限制,语言模型很容易生成与外部参考不一致的答案。为了解决这些问题,我们提出了验证链 (CoV-RAG) 来增强外部检索的正确性和内部生成的连贯性。具体来说,我们将验证模块集成到 RAG 中,进行评分、判断和重写。为了纠正外部检索错误,CoV-RAG 使用修正后的查询检索新知识。为了纠正内部生成错误,我们在训练过程中使用思维链 (CoT) 推理将问答和验证任务统一起来。我们在各种 LLM 上进行的全面实验表明,与其他强大的基线相比,该方法是有效且适应性强的。特别是,我们的 CoV-RAG 可以使用不同的 LLM 主干显著超越最先进的基线。