LLM2D
CAST:基于交叉注意力的结构与文本多模态融合材料性质预测
CAST: Cross Attention based multimodal fusion of Structure and Text for materials property prediction
作者: Jaewan Lee, Changyoung Park, Hongjun Yang, Sungbin Lim, Sehui Han
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.06836v1

摘要

arXiv:2502.06836v1 交叉类型公告 摘要:近期在人工智能领域的进展彻底改变了材料科学中的属性预测并加速了新材料的发现。图神经网络(GNNs)因其能够将晶体结构表示为图,有效地捕捉局部相互作用并提供优越的预测而脱颖而出。然而,这些方法往往会丢失关键的全局信息,如晶体系统和重复单元的连接性。为了解决这个问题,我们提出了一种基于交叉注意力的多模态融合模型CAST,该模型将图和文本模态结合起来以保留重要材料信息。CAST 通过交叉注意力机制结合节点级和标记级特征,超越了依赖材料级嵌入技术如图平均池化或[CLS]标记的先前方法。通过掩码节点预测预训练策略进一步增强了原子级信息的整合。我们的方法在晶体带隙等四个晶体属性的属性预测中,相对于CrysMMNet和MultiMat等方法,最高取得了22.9%的改进。预训练是使节点和文本嵌入对齐的关键,注意力图进一步证实了其在捕捉节点和标记之间关系方面的有效性。这项研究突显了多模态学习在材料科学中的潜力,为结合局部和全局信息的更健壮预测模型铺平了道路。