LLM2D

摘要

近年来，检索增强生成 (RAG) 旨在通过整合从外部来源检索到的海量知识来增强大型语言模型 (LLM)。然而，这种方法面临着一些挑战：首先，原始查询可能不适合精确检索，导致上下文知识错误；其次，由于知识边界限制，语言模型很容易生成与外部参考不一致的答案。为了解决这些问题，我们提出了验证链 (CoV-RAG) 来增强外部检索的正确性和内部生成的连贯性。具体来说，我们将验证模块集成到 RAG 中，进行评分、判断和重写。为了纠正外部检索错误，CoV-RAG 使用修正后的查询检索新知识。为了纠正内部生成错误，我们在训练过程中使用思维链 (CoT) 推理将问答和验证任务统一起来。我们在各种 LLM 上进行的全面实验表明，与其他强大的基线相比，该方法是有效且适应性强的。特别是，我们的 CoV-RAG 可以使用不同的 LLM 主干显著超越最先进的基线。