LLM2D
稀疏几何消息传递神经网络的表达能力
On the Expressive Power of Sparse Geometric MPNNs
作者: Yonatan Sverdlov, Nadav Dym
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2407.02025v2

摘要

受化学和其他科学应用的启发,我们研究了用于几何图的消息传递神经网络的表达能力,其节点特征对应于三维位置。最近的研究表明,此类模型可以分离非同构几何图的一般对,尽管它们可能无法分离一些罕见和复杂的实例。然而,这些结果假设了一个完全连接的图,其中每个节点都拥有所有其他节点的完整知识。相反,在应用中,每个节点通常只拥有少量最近邻的知识。 本文表明,只要底层图是连通的,具有旋转等变特征的消息传递网络就可以分离非同构几何图的一般对。当仅允许不变的中间特征时,对于一般全局刚性图,可以保证一般分离。我们引入了一个简单的架构 $\us$,它实现了我们的理论保证,并在合成和化学基准测试中与替代架构相比具有优势。我们的代码可在 \url{https://github.com/yonatansverdlov/E-GenNet} 获取。