摘要
arXiv:2502.14902v1 类型: cross
摘要: 通过从外部数据库检索知识来提高大型语言模型(LLMs)响应质量的检索增强生成(RAG)方法通过检索外部数据库的知识来提高大型语言模型(LLMs)的响应质量。典型的RAG方法将文本数据库分割成片段,并组织成扁平结构以实现高效的搜索。为更好地捕获文本数据库中内在的依赖关系和结构化关系,研究人员提出了将文本信息组织成索引图的方法,即基于图的RAG。然而,我们认为当前基于图的RAG方法的局限性在于检索信息的冗余性,而非不足之处。此外,先前的方法使用扁平结构来组织提示中的检索信息,导致性能不佳。为了克服这些局限性,我们提出了PathRAG,它从索引图中检索关键关系路径,并将这些路径转换成文本形式以供LLMs提示。具体而言,PathRAG通过基于路径的提示有效地减少了冗余信息,同时指导LLMs生成更逻辑性和连贯性的响应。实验结果显示,PathRAG在六个数据集和五个评估维度上始终优于最先进的基线方法。代码可在以下链接获取:https://github.com/BUPT-GAMMA/PathRAG