摘要
预测药物-靶标相互作用 (DTI) 在药物发现过程中至关重要。尽管最近通过整合来自不同药物和靶标编码器的表征,DTI 模型取得了显著进展,但此类模型通常难以捕捉药物和蛋白质之间的细粒度相互作用,即特定药物原子(或亚结构)与蛋白质关键氨基酸的结合,而这对于理解结合机制和优化药物设计至关重要。为了解决这个问题,本文提出了一种名为 FusionDTI 的新型模型,该模型使用令牌级融合模块来有效地学习药物-靶标相互作用的细粒度信息。具体而言,我们的 FusionDTI 模型使用药物的 SELFIES 表征来缓解序列片段失效问题,并结合靶蛋白的结构感知 (SA) 词汇来解决氨基酸序列在结构信息方面的局限性,此外还利用在大型生物医学数据集上广泛训练的预训练语言模型作为编码器来捕捉药物和靶标的复杂信息。在三个著名的基准数据集上的实验表明,与七个现有的最先进的基线相比,我们提出的 FusionDTI 模型在 DTI 预测方面取得了最佳性能。此外,我们的案例研究表明 FusionDTI 可以突出潜在的结合位点,从而增强 DTI 预测的可解释性。