摘要
材料科学知识广泛分散在大量的科学文献中,给新材料的有效发现和整合带来了巨大的挑战。传统的材料发现方法通常依赖于昂贵且耗时的实验方法,进一步阻碍了快速创新。为了应对这些挑战,人工智能与材料科学的结合为加速材料发现过程开辟了道路,但也对信息的精确标注、数据提取和可追溯性提出了更高的要求。为了解决这些问题,本文介绍了材料知识图谱(MKG),它利用先进的自然语言处理技术,与大型语言模型相结合,将十年的高质量研究成果提取并系统地组织成结构化的三元组,包含162,605个节点和731,772条边。MKG将信息分类成全面的标签,如名称、公式和应用,并围绕精心设计的本体结构进行组织,从而增强了数据的可用性和集成性。通过实施基于网络的算法,MKG不仅能有效地进行链接预测,还能显著减少对传统实验方法的依赖。这种结构化的方法不仅简化了材料研究,也为更复杂的科学知识图谱奠定了基础。