LLM2D
G-RAG:材料科学中的知识扩展
G-RAG: Knowledge Expansion in Material Science
作者: Radeen Mostafa, Mirza Nihal Baig, Mashaekh Tausif Ehsan, Jakir Hasan
发布日期: 11/25/2024
arXiv ID: oai:arXiv.org:2411.14592v1

摘要

在材料科学领域,有效的文献检索系统对于促进研究至关重要。大型语言模型(LLM)中传统的检索增强生成(RAG)方法常常面临信息过时、幻觉、上下文限制导致的可解释性有限以及检索不准确等挑战。为了解决这些问题,图RAG通过集成图数据库来增强检索过程。我们提出的方法通过从句子中提取关键实体(称为MatIDs)来处理材料科学文献,然后利用这些实体查询外部维基百科知识库(KB)以获取更多相关信息。我们实现了一种基于代理的解析技术,以获得更详细的文档表示。我们改进的图RAG版本,即G-RAG,进一步利用图数据库来捕获这些实体之间的关系,从而提高检索准确性和上下文理解能力。这种增强的方案在需要精确信息检索的领域(如材料科学)中展现出显著的性能提升。