LLM2D

摘要

arXiv:2402.01744v4 通知类型: replace-cross 摘要：背景：虚拟筛选(VS)已成为药物发现中不可或缺的工具，使研究人员能够迅速而经济地识别潜在的生物活性分子。近年来，图神经网络(GNNs)因其能使用图基表示法来建模复杂分子结构的能力受到了关注。然而，将解释性方法整合进来，以阐明分子亚结构对生物活性的具体贡献仍是一个重大挑战。这一限制阻碍了预测模型的可解释性和新型药物的理性设计。结果显示：我们针对小分子训练了20个GNN模型，目标是预测这些小分子在20种不同激酶家族蛋白质靶点上的活性。这些分类器在虚拟筛选任务中达到了最先进的性能，在不同靶点上显示了高准确性和鲁棒性。在此基础上，我们实现了层次化Grad-CAM图解释框架(HGE)，以深入分析驱动蛋白-配体相互作用稳定化的分子片段。HGE利用原子、环和整个分子层面的Grad-CAM解释，并利用消息传递机制突出显示最相关的化学片段。文献中的实验数据验证了解释器能够识别药物分子模式，并正确地将其注释到已知靶点的能力。结论：我们的方法可能是一种有效的支持，以缩短筛选和候选药物发现过程。对参与结合过程的分子亚结构的详细了解可以帮助计算化学家了解结构优化，并在药物再利用任务中获得洞察。