摘要
arXiv:2504.16479v1 类别: cross
摘要: 蛋白质从头设计是指创造具有特定结构和功能的人工蛋白质,这些蛋白质在自然界中并不存在。近年来,高质量的蛋白质结构和序列数据的积累以及技术进步为使用生成式人工智能(AI)模型在蛋白质设计中的成功应用铺平了道路。这些模型已超越了依赖片段和生物信息学的传统方法,显著提高了从头蛋白质设计的成功率,并降低了实验成本,从而推动了该领域的突破。在各种生成式AI模型中,蛋白质设计中扩散模型取得了最令人鼓舞的结果。在过去两到三年中,基于扩散模型的蛋白质设计模型超过了十种。其中,代表性模型RFDiffusion在25项蛋白质设计任务中的成功率远超传统方法和其他基于AI的方法,如RFjoint和hallucination。本文将系统地探讨扩散模型在生成蛋白质主链和序列中的应用。我们将探讨不同模型的优势和局限性,总结使用扩散模型进行蛋白质设计的成功案例,并讨论未来的发展方向。