LLM2D

摘要

arXiv:2504.14858v1 发布类型: 新摘要: 回忆增强生成（RAG）已成为基于知识的文本生成的基础范式。然而，现有的RAG管道往往无法确保生成的推理轨迹与检索内容施加的证据约束一致。在本文中，我们重新定义RAG为 retrieval-aware 推理问题，并识别出一个核心挑战：推理失衡——模型的推理轨迹与检索到的证据之间的不匹配。为了解决这一挑战，我们提出了 AlignRAG，这是一种新的测试时框架，通过迭代的 Critique-Driven Alignment (CDA) 步骤来缓解推理失衡。与依赖静态训练或事后选择的先前方法不同，AlignRAG 在推理过程中积极地通过证据的细粒度对齐来细化推理轨迹。我们的框架通过以下方式引入一种 retrieval-aware 推理的新范式：（1）构建丰富的训练语料库；（2）从意识偏好的推理轨迹中生成对比批评；（3）训练一个专门的 Critic 语言模型（CLM）以识别推理失衡；（4）应用 CDA 步骤以迭代优化推理轨迹。实验证明，AlignRAG 一贯优于所有基线方法，并且可以在不进行进一步更改的情况下集成到现有的 RAG 管道中作为即插即用模块。通过将 RAG 重新概念化为结构化的推理轨迹，并建立了用于在 RAG 中纠正推理失衡的测试时框架，AlignRAG 为 retrieval-aware 生成提供了实用的进步。