LLM2D
基于关系路径的图抽取增强生成剪枝:PathRAG
PathRAG: Pruning Graph-based Retrieval Augmented Generation with Relational Paths
作者: Boyu Chen, Zirui Guo, Zidan Yang, Yuluo Chen, Junze Chen, Zhenghao Liu, Chuan Shi, Cheng Yang
发布日期: 2/24/2025
arXiv ID: oai:arXiv.org:2502.14902v1

摘要

arXiv:2502.14902v1 类型: cross 摘要: 通过从外部数据库检索知识来提高大型语言模型(LLMs)响应质量的检索增强生成(RAG)方法通过检索外部数据库的知识来提高大型语言模型(LLMs)的响应质量。典型的RAG方法将文本数据库分割成片段,并组织成扁平结构以实现高效的搜索。为更好地捕获文本数据库中内在的依赖关系和结构化关系,研究人员提出了将文本信息组织成索引图的方法,即基于图的RAG。然而,我们认为当前基于图的RAG方法的局限性在于检索信息的冗余性,而非不足之处。此外,先前的方法使用扁平结构来组织提示中的检索信息,导致性能不佳。为了克服这些局限性,我们提出了PathRAG,它从索引图中检索关键关系路径,并将这些路径转换成文本形式以供LLMs提示。具体而言,PathRAG通过基于路径的提示有效地减少了冗余信息,同时指导LLMs生成更逻辑性和连贯性的响应。实验结果显示,PathRAG在六个数据集和五个评估维度上始终优于最先进的基线方法。代码可在以下链接获取:https://github.com/BUPT-GAMMA/PathRAG