LLM2D

摘要

arXiv:2502.09891v1 类别: cross 摘要: 检索增强生成（RAG）已被证明在将外部知识集成到大型语言模型（LLMs）中进行问答（QA）任务中是有效的。最新的RAG方法通常使用图数据作为外部数据，因为它们能够捕获丰富的语义信息并链接实体之间的关系。然而，现有的基于图的RAG方法无法准确地从图中识别相关信息，并且在在线检索过程中消耗了大量的令牌。为了解决这些问题，我们提出了一种新的基于图的RAG方法，称为Attributed Community-based Hierarchical RAG（ArchRAG），该方法通过使用属性社区来扩充问题，并引入了一种新的基于LLM的层次聚类方法。为了从图中为问题检索最相关的信息，我们构建了一种新的层次索引结构，用于属性社区，并开发了一种有效的在线检索方法。实验结果表明，ArchRAG在准确性和令牌成本方面均优于现有方法。