LLM2D
RuleRAG:规则引导的检索增强生成模型在问答中的应用
RuleRAG: Rule-Guided Retrieval-Augmented Generation with Language Models for Question Answering
作者: Zhongwu Chen, Chengjin Xu, Dingmin Wang, Zhen Huang, Yong Dou, Xuhui Jiang, Jian Guo
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2410.22353v3

摘要

arXiv:2410.22353v3 通告类型: replace-cross 摘要:检索增强生成(RAG)在知识密集型问答(QA)方面展示了有前途的潜力。然而,现有的方法仅考虑查询本身,既没有为检索器指定检索偏好,也没有告知生成器如何引用检索到的文档来生成答案,这给问答性能带来了重大挑战。为了解决这些问题,我们提出了带有LM的规则引导检索增强生成(Rule-guided Retrieval-Augmented Generation with LMs,简称RuleRAG-ICL),显式地引入了上下文学习规则(RuleRAG-ICL)来引导检索器按照规则的指引回忆相关文档,并一致地指导生成器根据同一规则进行推理。此外,大多数现有的RAG数据集是在未考虑规则的情况下构建的,而知识图谱(KGs)被认可为提供高质量规则的支持。因此,我们基于知识图谱构建了五个规则感知的RAG基准数据集,名为RuleQA,以强调规则检索和推理的重要性。在RuleQA上的实验表明,在Recall@10上,RuleRAG-ICL提高了89.2%,在精确匹配上提高了103.1%的答对率,而RuleRAG-FT表现更为突出。此外,对四个现有RAG数据集的实验显示,通过在RuleQA中提供规则,RuleRAG也同样有效,进一步证明了RuleRAG中规则指导的泛化能力。