摘要
近年来,检索增强生成 (RAG) 旨在通过整合从外部来源检索到的海量知识来增强大型语言模型 (LLM)。然而,这种方法面临着一些挑战:首先,原始查询可能不适合精确检索,导致上下文知识错误;其次,由于知识边界限制,语言模型很容易生成与外部参考不一致的答案。为了解决这些问题,我们提出了验证链 (CoV-RAG) 来增强外部检索的正确性和内部生成的连贯性。具体来说,我们将验证模块集成到 RAG 中,进行评分、判断和重写。为了纠正外部检索错误,CoV-RAG 使用修正后的查询检索新知识。为了纠正内部生成错误,我们在训练过程中使用思维链 (CoT) 推理将问答和验证任务统一起来。我们在各种 LLM 上进行的全面实验表明,与其他强大的基线相比,该方法是有效且适应性强的。特别是,我们的 CoV-RAG 可以使用不同的 LLM 主干显著超越最先进的基线。