LLM2D

摘要

arXiv:2504.11544v1 通知类型: 新摘要: 检索增强生成 (RAG) 使大规模语言模型能够访问外部和私有语料库，从而在特定领域内实现事实一致的响应。通过利用语料库的固有结构，基于图的 RAG 方法进一步丰富了这一过程，通过构建知识图谱索引并利用图的结构特性。然而，当前基于图的 RAG 方法很少优先考虑图结构的设计。设计不当的图不仅阻碍了各种图算法的无缝集成，而且还导致工作流程不一致性并降低性能。为进一步释放图在 RAG 中的潜力，我们提出了 NodeRAG，这是一种基于图的框架，引入了异质图结构，使图基方法能够无缝且全面地集成到 RAG 工作流中。通过紧密配合 LLM 的能力，该框架确保了端到端流程的一致性和高效性。通过广泛的实验，我们证明了 NodeRAG 在索引时间、查询时间和存储效率方面表现出色，并且在多跳基准和与 LightRAG 和 GraphRAG 进行开放性直接对抗测试时，在最小检索令牌的情况下提供了更优越的问答性能。我们的 GitHub 仓库可在 https://github.com/Terry-Xu-666/NodeRAG 查看。