LLM2D
一种用于学习蛋白质-配体结合动力学的多分辨率对称微分方程模型
A Multi-Grained Symmetric Differential Equation Model for Learning Protein-Ligand Binding Dynamics
作者: Shengchao Liu, Weitao Du, Hannan Xu, Yanjing Li, Zhuoxinran Li, Vignesh Bhethanabotla, Divin Yan, Christian Borgs, Anima Anandkumar, Hongyu Guo, Jennifer Chayes
发布日期: 11/27/2024
arXiv ID: oai:arXiv.org:2401.15122v3

摘要

在药物发现中,用于蛋白质-配体结合的分子动力学 (MD) 模拟为预测结合亲和力、估计传输特性和探索口袋位点提供了一种强大的工具。长期以来,人们一直致力于通过改进的数值方法以及最近利用机器学习 (ML) 方法来提高 MD 模拟的效率。然而,仍然存在一些挑战,例如对扩展时间尺度模拟的精确建模。为了解决这个问题,我们提出了 NeuralMD,这是第一个可以促进数值 MD 并提供蛋白质-配体结合动力学精确模拟的 ML 代理模型。我们提出了一种基于原理的方法,该方法结合了一种新颖的物理信息多粒度群对称框架。具体来说,我们提出了 (1) 使用向量框架满足群对称性并捕获多层次蛋白质-配体相互作用的 BindingNet 模型,以及 (2) 一个增强的神经微分方程求解器,该求解器学习牛顿力学下的轨迹。在实验中,我们设计了十个单轨迹和三个多轨迹结合模拟任务。我们证明了 NeuralMD 的效率和有效性,与标准数值 MD 模拟相比,其速度提高了 1000 倍以上。NeuralMD 还优于所有其他 ML 方法,重建误差降低了 15 倍,有效性提高了 70%。此外,我们定性地说明,预测轨迹中的振荡与其他机器学习方法相比,更接近于真实动力学。我们相信 NeuralMD 为模拟蛋白质-配体动力学的新研究范式奠定了基础。