摘要
在药物发现中,用于蛋白质-配体结合的分子动力学 (MD) 模拟为预测结合亲和力、估计传输特性和探索口袋位点提供了一种强大的工具。长期以来,人们一直致力于通过改进的数值方法以及最近利用机器学习 (ML) 方法来提高 MD 模拟的效率。然而,仍然存在一些挑战,例如对扩展时间尺度模拟的精确建模。为了解决这个问题,我们提出了 NeuralMD,这是第一个可以促进数值 MD 并提供蛋白质-配体结合动力学精确模拟的 ML 代理模型。我们提出了一种基于原理的方法,该方法结合了一种新颖的物理信息多粒度群对称框架。具体来说,我们提出了 (1) 使用向量框架满足群对称性并捕获多层次蛋白质-配体相互作用的 BindingNet 模型,以及 (2) 一个增强的神经微分方程求解器,该求解器学习牛顿力学下的轨迹。在实验中,我们设计了十个单轨迹和三个多轨迹结合模拟任务。我们证明了 NeuralMD 的效率和有效性,与标准数值 MD 模拟相比,其速度提高了 1000 倍以上。NeuralMD 还优于所有其他 ML 方法,重建误差降低了 15 倍,有效性提高了 70%。此外,我们定性地说明,预测轨迹中的振荡与其他机器学习方法相比,更接近于真实动力学。我们相信 NeuralMD 为模拟蛋白质-配体动力学的新研究范式奠定了基础。