LLM2D
通过大型语言模型构建和应用于多学科材料科学的材料知识图谱
Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model
作者: Yanpeng Ye, Jie Ren, Shaozhou Wang, Yuwei Wan, Imran Razzak, Bram Hoex, Haofen Wang, Tong Xie, Wenjie Zhang
发布日期: 5/15/2025
arXiv ID: oai:arXiv.org:2404.03080v4

摘要

arXiv:2404.03080v4 宣布类型: replace-cross 摘要:材料科学的知识广泛分散在大量的科学文献中,这给高效发现和整合新材料带来了巨大挑战。传统方法通常依赖于昂贵且耗时的实验方法,进一步增加了快速创新的复杂性。为应对这些挑战,将人工智能与材料科学相结合已开辟了加速发现过程的新途径,但也需要精确注释、数据提取和信息的可追溯性。为解决这些问题,本文介绍了材料知识图谱(MKG),它利用先进的自然语言处理技术与大型语言模型结合,提取并系统地组织了十年高质量研究数据为结构化的三元组,包含162,605个节点和731,772条边。MKG 通过详细设计的本体将信息分类为全面的标签,如名称、公式和应用,从而提高数据的可用性和集成度。通过实施基于网络的算法,MKG 不仅促进了高效的链接预测,还显著减少了对传统实验方法的依赖。这种结构化方法不仅简化了材料研究,也为更复杂的科学知识图谱奠定了基础。