摘要
arXiv:2504.11091v1 交叉公告类型:交叉
摘要:抗生素耐药性构成了一个日益严重的全球健康危机,需要新的治疗策略来针对新型细菌机制。近年来,蛋白质结构预测以及机器学习驱动的小分子生成的进展为加速新药发现提供了希望。然而,关于如何选择和将这些模型整合到现实世界的工作流程中的实用指导仍然有限。在这项研究中,我们开发了一个从靶标识别到化合物实现的端到端的人工智能引导抗生素发现管道。我们利用预测的多种病原体蛋白质组的空间结构聚类,来识别保守的、必需的和非人源同源的靶标。然后,我们系统地评估了六种领先的三维结构感知生成模型——涵盖扩散、自回归、图神经网络和语言模型架构——在其实用性、化学有效性以及生物学相关性方面的表现。严格的后期处理过滤和商业同系物搜索将超过100,000种生成的化合物精简为一个专注于合成的集合。我们的结果突显了DeepBlock和TamGen在多种评价标准下的优异表现,同时也揭示了模型复杂性、实用性与输出质量之间的重要权衡。这项工作提供了一个比较基准和蓝图,用于早期抗生素开发中部署人工智能。