LLM2D
RuleRAG:基于规则的检索增强生成模型在问答中的应用
RuleRAG: Rule-Guided Retrieval-Augmented Generation with Language Models for Question Answering
作者: Zhongwu Chen, Chengjin Xu, Dingmin Wang, Zhen Huang, Yong Dou, Jian Guo
发布日期: 2/6/2025
arXiv ID: oai:arXiv.org:2410.22353v2

摘要

arXiv:2410.22353v2 通告类型: 替换-交叉 摘要:检索增强生成(RAG)在知识密集型问题回答(QA)中展现出了令人鼓舞的潜力。然而,现有的方法仅考虑查询本身,并未明确为检索器指定检索偏好,也未告知生成器如何引用检索到的文档来作答,这对QA性能构成了重大挑战。为了解决这些问题,我们提出了一种基于LM的规则引导检索增强生成(Rule-guided Retrieval-Augmented Generation with LMs),其中明确引入了上下文学习规则(RuleRAG-ICL)来指导检索器按照规则的方向回溯相关文档,并均匀地指导生成器按照相同的规则进行推理。此外,现有的大多数RAG数据集在构建时并未考虑规则和知识图谱(KGs),而KGs被认识到能提供高质量的规则。因此,我们基于KGs构建了五个规则感知的RAG基准测试集RuleQA,以强调规则检索和推理的重要性。在RuleQA上的实验表明,RuleRAG-ICL在Recall@10上提高了89.2%,在精确匹配上的答案准确性提高了103.1%,并且RuleRAG-FT表现更佳。此外,对四个现有RAG数据集的实验显示,通过在RuleQA中提供规则,RuleRAG也能发挥作用,进一步证明了RuleRAG中规则指导的通用性。