LLM2D

摘要

arXiv:2502.14902v1 类型: cross 摘要: 通过从外部数据库检索知识来提高大型语言模型（LLMs）响应质量的检索增强生成（RAG）方法通过检索外部数据库的知识来提高大型语言模型（LLMs）的响应质量。典型的RAG方法将文本数据库分割成片段，并组织成扁平结构以实现高效的搜索。为更好地捕获文本数据库中内在的依赖关系和结构化关系，研究人员提出了将文本信息组织成索引图的方法，即基于图的RAG。然而，我们认为当前基于图的RAG方法的局限性在于检索信息的冗余性，而非不足之处。此外，先前的方法使用扁平结构来组织提示中的检索信息，导致性能不佳。为了克服这些局限性，我们提出了PathRAG，它从索引图中检索关键关系路径，并将这些路径转换成文本形式以供LLMs提示。具体而言，PathRAG通过基于路径的提示有效地减少了冗余信息，同时指导LLMs生成更逻辑性和连贯性的响应。实验结果显示，PathRAG在六个数据集和五个评估维度上始终优于最先进的基线方法。代码可在以下链接获取：https://github.com/BUPT-GAMMA/PathRAG