LLM2D
FusionDTI:基于词元级融合的细粒度药物靶标相互作用结合位点发现
FusionDTI: Fine-grained Binding Discovery with Token-level Fusion for Drug-Target Interaction
作者: Zhaohan Meng, Zaiqiao Meng, Ke Yuan, Iadh Ounis
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2406.01651v3

摘要

预测药物-靶标相互作用 (DTI) 在药物研发过程中至关重要。尽管最近通过整合来自不同药物和靶标编码器的表征,DTI 模型取得了显著进展,但此类模型往往难以捕捉药物和蛋白质之间细粒度的相互作用,即特定药物原子(或亚结构)与蛋白质关键氨基酸的结合,而这对于理解结合机制和优化药物设计至关重要。为了解决这个问题,本文介绍了一种新模型 FusionDTI,它使用基于标记的融合模块来有效学习药物-靶标相互作用的细粒度信息。特别是,我们的 FusionDTI 模型使用药物的 SELFIES 表示来减轻序列片段失效问题,并结合靶蛋白的结构感知 (SA) 词汇来解决氨基酸序列在结构信息方面的局限性,此外还利用在大规模生物医学数据集上广泛训练的预训练语言模型作为编码器来捕捉药物和靶标的复杂信息。在三个著名的基准数据集上的实验表明,与七个现有的最先进的基线相比,我们提出的 FusionDTI 模型在 DTI 预测中取得了最佳性能。此外,我们的案例研究表明,FusionDTI 可以突出潜在的结合位点,增强 DTI 预测的可解释性。