LLM2D

摘要

配体结合对蛋白质结构及其体内功能的影响对现代生物医学研究和生物技术发展工作（如药物发现）具有重要意义。尽管最近引入了几种针对蛋白质-配体对接的深度学习 (DL) 方法和基准，但迄今为止，还没有先前的研究系统地研究对接方法在以下广泛适用的情况下行为：（1）使用预测的（无配体）蛋白质结构进行对接（例如，适用于未知结构）；（2）将多个配体同时对接到给定的目标蛋白质（例如，用于酶设计）；以及（3）没有关于结合口袋的先验知识（例如，用于未知口袋泛化）。为了更深入地了解对接方法在现实世界中的实用性，我们引入了 PoseBench，这是一个针对广泛适用的蛋白质-配体对接的第一个综合基准。PoseBench 使研究人员能够严格而系统地评估 DL 对接方法，用于无配体到有配体的蛋白质-配体对接和蛋白质-配体结构生成，使用单配体和多配体基准数据集，后者是我们在 DL 社区中首次引入的。根据经验，使用 PoseBench，我们发现：(1) DL 方法始终优于传统对接算法；(2) 最新的 DL 对接方法未能泛化到多配体蛋白质靶标；(3) 使用物理信息损失函数对蛋白质-配体复合物的不同簇进行训练 DL 方法是未来工作的一个有希望的方向。代码、数据、教程和基准结果可在 https://github.com/BioinfoMachineLearning/PoseBench 获取。