摘要
arXiv:2504.04654v1 交叉类型:
摘要: 在计算药物发现中,化合物-蛋白质相互作用(CPI)的准确预测仍然是一个核心挑战。现有基于序列的方法利用了分子指纹或图表示,但它们严重忽视了结合亲和力的三维(3D)结构决定因素。为解决这一问题,我们提出了EquiCPI,这是一种端到端的几何深度学习框架,结合了第一性原理结构建模和SE(3)-泛对称神经网络。我们的工作流程通过ESMFold将原始序列转换为蛋白质的3D原子坐标,并通过DiffDock-L将配体转换为3D原子坐标,随后进行基于物理的构象重新排序和泛对称特征学习。核心而言,EquiCPI 采用SE(3)-泛对称的消息传递来处理原子点云,保留了在旋转、平移和反射下的对称性,并通过球谐函数的张量积层级化编码局部相互作用模式。所提出模型在BindingDB(亲和力预测)和DUD-E(虚拟筛选)上进行评估,EquiCPI 的性能与或优于当前最先进的深度学习竞争对手。