摘要
arXiv:2410.22353v3 通告类型: replace-cross
摘要:检索增强生成(RAG)在知识密集型问答(QA)方面展示了有前途的潜力。然而,现有的方法仅考虑查询本身,既没有为检索器指定检索偏好,也没有告知生成器如何引用检索到的文档来生成答案,这给问答性能带来了重大挑战。为了解决这些问题,我们提出了带有LM的规则引导检索增强生成(Rule-guided Retrieval-Augmented Generation with LMs,简称RuleRAG-ICL),显式地引入了上下文学习规则(RuleRAG-ICL)来引导检索器按照规则的指引回忆相关文档,并一致地指导生成器根据同一规则进行推理。此外,大多数现有的RAG数据集是在未考虑规则的情况下构建的,而知识图谱(KGs)被认可为提供高质量规则的支持。因此,我们基于知识图谱构建了五个规则感知的RAG基准数据集,名为RuleQA,以强调规则检索和推理的重要性。在RuleQA上的实验表明,在Recall@10上,RuleRAG-ICL提高了89.2%,在精确匹配上提高了103.1%的答对率,而RuleRAG-FT表现更为突出。此外,对四个现有RAG数据集的实验显示,通过在RuleQA中提供规则,RuleRAG也同样有效,进一步证明了RuleRAG中规则指导的泛化能力。