LLM2D

摘要

arXiv:2410.22353v2 通告类型: 替换-交叉摘要：检索增强生成（RAG）在知识密集型问题回答（QA）中展现出了令人鼓舞的潜力。然而，现有的方法仅考虑查询本身，并未明确为检索器指定检索偏好，也未告知生成器如何引用检索到的文档来作答，这对QA性能构成了重大挑战。为了解决这些问题，我们提出了一种基于LM的规则引导检索增强生成（Rule-guided Retrieval-Augmented Generation with LMs），其中明确引入了上下文学习规则（RuleRAG-ICL）来指导检索器按照规则的方向回溯相关文档，并均匀地指导生成器按照相同的规则进行推理。此外，现有的大多数RAG数据集在构建时并未考虑规则和知识图谱（KGs），而KGs被认识到能提供高质量的规则。因此，我们基于KGs构建了五个规则感知的RAG基准测试集RuleQA，以强调规则检索和推理的重要性。在RuleQA上的实验表明，RuleRAG-ICL在Recall@10上提高了89.2%，在精确匹配上的答案准确性提高了103.1%，并且RuleRAG-FT表现更佳。此外，对四个现有RAG数据集的实验显示，通过在RuleQA中提供规则，RuleRAG也能发挥作用，进一步证明了RuleRAG中规则指导的通用性。