LLM2D

摘要

arXiv:2410.22353v3 通告类型: replace-cross 摘要：检索增强生成（RAG）在知识密集型问答（QA）方面展示了有前途的潜力。然而，现有的方法仅考虑查询本身，既没有为检索器指定检索偏好，也没有告知生成器如何引用检索到的文档来生成答案，这给问答性能带来了重大挑战。为了解决这些问题，我们提出了带有LM的规则引导检索增强生成（Rule-guided Retrieval-Augmented Generation with LMs，简称RuleRAG-ICL），显式地引入了上下文学习规则（RuleRAG-ICL）来引导检索器按照规则的指引回忆相关文档，并一致地指导生成器根据同一规则进行推理。此外，大多数现有的RAG数据集是在未考虑规则的情况下构建的，而知识图谱（KGs）被认可为提供高质量规则的支持。因此，我们基于知识图谱构建了五个规则感知的RAG基准数据集，名为RuleQA，以强调规则检索和推理的重要性。在RuleQA上的实验表明，在Recall@10上，RuleRAG-ICL提高了89.2%，在精确匹配上提高了103.1%的答对率，而RuleRAG-FT表现更为突出。此外，对四个现有RAG数据集的实验显示，通过在RuleQA中提供规则，RuleRAG也同样有效，进一步证明了RuleRAG中规则指导的泛化能力。