LLM2D
基于分子指纹图谱解决药物-药物相互作用预测中的模型过拟合问题
Addressing Model Overcomplexity in Drug-Drug Interaction Prediction With Molecular Fingerprints
作者: Manel Gil-Sorribes, Alexis Molina
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.23550v1

摘要

arXiv:2503.23550v1 交叉公告类型:cross 摘要:准确预测药物-药物相互作用(DDIs)对于制药研究和临床安全性至关重要。近期的深度学习模型经常面临高计算成本和在不同数据集上的有限泛化能力。在这项研究中,我们探讨了一种简单且有效的方法,使用诸如 Morgan 指纹(MFPS)、基于图卷积网络(GCNs)的图嵌入以及 MoLFormer 提取的基于变换器的嵌入,并将这些嵌入整合到一个简单的神经网络中。我们在 DrugBank DDI 分割数据集和食品药品监督管理局提供的药物-药物亲和力(DDA)数据集上对我们的实现进行了基准测试。MFPS 与 MoLFormer 和 GCN 表征在任务上均表现出竞争性性能,即使在更具挑战性的防范泄露分割中也是如此,突显了简单分子表征的充分性。此外,我们能够通过基于梯度的分析识别出相关于药物相互作用的关键分子模式和结构模式。尽管取得这些成果,但由于数据集限制,如化学多样性不足、数据集规模有限以及标注不一致等问题,仍对稳健评估造成影响,并挑战了更复杂方法的必要性。我们的工作提供了一个有意义的基准,并强调了需要更好的数据集编目和逐步增加复杂性的需求。