摘要
arXiv:2502.09891v1 类别: cross
摘要: 检索增强生成(RAG)已被证明在将外部知识集成到大型语言模型(LLMs)中进行问答(QA)任务中是有效的。最新的RAG方法通常使用图数据作为外部数据,因为它们能够捕获丰富的语义信息并链接实体之间的关系。然而,现有的基于图的RAG方法无法准确地从图中识别相关信息,并且在在线检索过程中消耗了大量的令牌。为了解决这些问题,我们提出了一种新的基于图的RAG方法,称为Attributed Community-based Hierarchical RAG(ArchRAG),该方法通过使用属性社区来扩充问题,并引入了一种新的基于LLM的层次聚类方法。为了从图中为问题检索最相关的信息,我们构建了一种新的层次索引结构,用于属性社区,并开发了一种有效的在线检索方法。实验结果表明,ArchRAG在准确性和令牌成本方面均优于现有方法。