LLM2D
利用大型语言模型预测抗体对流感A型血凝素的生物学活性
Leveraging Large Language Models to Predict Antibody Biological Activity Against Influenza A Hemagglutinin
作者: Ella Barkan, Ibrahim Siddiqui, Kevin J. Cheng, Alex Golts, Yoel Shoshan, Jeffrey K. Weber, Yailin Campos Mota, Michal Ozery-Flato, Giuseppe A. Sautto
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2502.00694v1

摘要

arXiv:2502.00694v1 交叉类型: 公告 摘要: 单克隆抗体 (mAbs) 是治疗自身免疫性疾病、传染病和癌症最常见的美国食品药品监督管理局 (FDA) 批准的治疗方式之一。然而,发现和开发治疗性抗体仍然是一个耗时且昂贵的过程。最近机器学习 (ML) 和人工智能 (AI) 的进步展示了在抗体发现和优化方面革命性的潜力。特别是,预测抗体生物学活性的模型可以实现基于计算的方法评估结合和功能性属性;这些模型可以优先考虑在昂贵且耗时的实验室测试程序中成功率较高的抗体。我们在这里探讨了一种用于预测针对流感 A 血凝素 (HA) 抗原的抗体结合和受体阻断活性的人工智能 (AI) 模型。我们的当前模型使用 MAMMAL 框架进行生物制品发现,仅使用序列信息预测抗体-抗原相互作用。为了评估模型的性能,我们根据各种数据拆分条件进行了测试,以模拟实际情景。 我们的模型在预测已知 HAs 上现有抗体的活性方面实现了 AUROC ≥ 0.91,在未知 HAs 上的 AUROC 为 0.9。对于新抗体活性预测,AUROC 为 0.73,且在对现有抗体相似性施加严格约束的情况下,进一步下降至 0.63-0.66。这些结果表明,基于 AI 的基础模型有可能通过减少对大量实验室测试的依赖并使抗体候选人的优先级安排更加高效来改变抗体设计。此外,我们的研究结果强调了为了提高预测模型的一般化能力,特别是对于新抗体开发,拥有多样性和全面的抗体数据集的重要性。