摘要
arXiv:2404.03080v5 公告类型: replace-cross
摘要:材料科学中的知识分散在广泛的科学文献中,这给新材料的高效发现和整合带来了重大挑战。传统方法往往依赖于成本高且耗时的实验方法,进一步加剧了快速创新的复杂性。针对这些挑战,将人工智能与材料科学的融合为加速发现过程开辟了途径,但这也要求精确标注、数据提取和信息可追溯性。为了解决这些问题,本文介绍了材料知识图谱(MKG),它利用先进的自然语言处理技术与大规模语言模型相结合,提取并系统地组织了十年来的高质量研究成果,其中包含162,605个节点和731,772条边。MKG将信息分类为全面的标签,如名称、公式和应用,并围绕精心设计的本体结构化,从而提高数据的可用性和整合性。通过实施基于网络的算法,MKG不仅促进了高效的链接预测,还显著减少了对传统实验方法的依赖。这种结构化的方法不仅简化了材料研究,也为更复杂的科学知识图谱奠定了基础。