LLM2D
FlowDock:几何流匹配生成蛋白-配体对接和亲和力预测
FlowDock: Geometric Flow Matching for Generative Protein-Ligand Docking and Affinity Prediction
作者: Alex Morehead, Jianlin Cheng
发布日期: 3/25/2025
arXiv ID: oai:arXiv.org:2412.10966v3

摘要

arXiv:2412.10966v3 宣告类型: replace-cross 摘要:最近提出了强大的蛋白质-配体结构生成AI模型,但很少有这些方法同时支持灵活的蛋白质-配体对接和亲和力估计。那些能够做到这一点的方法中,没有一种可以直接并发地建模多种结合配体,或者在药理学相关的药物靶标上进行了严格基准测试,这阻碍了其在药物发现中的广泛应用。在这项工作中,我们提出了FlowDock,这是第一个基于条件流匹配的深层几何生成模型,它学习将未结合(apo)结构直接映射为其结合(holo)对应物,用于任意数量的结合配体。此外,FlowDock在其生成的蛋白质-配体复合结构中提供了预测的结构置信分数和亲和力值,这使用户能够快速虚拟筛选新的(多配体)药物靶标。对于知名的PoseBusters基准数据集,FlowDock在输入未结合(apo)蛋白质结构的情况下,与单序列AlphaFold 3相比,盲对接成功率达到了51%,且没有利用多序列比对获得的任何信息,而对挑战性的新DockGen-E数据集,FlowDock优于单序列AlphaFold 3,并且在结合口袋泛化方面与单序列Chai-1相当。此外,在16届关联评估技术批判性评估(CASP16)中,FlowDock在140个蛋白质-配体复合物的药理学结合亲和力估计类别中排名前五,证明了其学习表示在虚拟筛选中的有效性。源代码、数据和预训练模型可在https://github.com/BioinfoMachineLearning/FlowDock获取。