LLM2D
JanusDDG:一种基于序列的蛋白质稳定性模型,通过两 fronts 多头注意力符合热力学原理
JanusDDG: A Thermodynamics-Compliant Model for Sequence-Based Protein Stability via Two-Fronts Multi-Head Attention
作者: Guido Barducci, Ivan Rossi, Francesco Codic\`e, Cesare Rollo, Valeria Repetto, Corrado Pancotti, Virginia Iannibelli, Tiziana Sanavia, Piero Fariselli
发布日期: 4/16/2025
arXiv ID: oai:arXiv.org:2504.03278v2

摘要

arXiv:2504.03278v2 Announce Type: replace-cross 摘要:理解残基变异如何影响蛋白质稳定性对于设计功能性蛋白质和揭示与疾病相关的突变的分子机制至关重要。近期蛋白质语言模型(PLMs)的发展已经革新了蛋白质的计算分析,使得例如对于突变效果的更准确预测成为可能。在本文中,我们引入了JanusDDG,一个深度学习框架,该框架利用PLM提取的嵌入和双向交叉注意力变换器架构来预测单个和多个残基突变的$\Delta \Delta G$值,同时受到保持基本热力学性质(如反对称性和传递性)的约束。与传统的自我注意力不同,JanusDDG 计算查询(Q)和值(V)为野生型和突变嵌入之间的差异,而键(K)则在两者之间交替。这种交叉间隔的注意力机制使模型能够捕捉突变引起的扰动同时保留关键的上下文信息。实验结果表明,JanusDDG 在仅从序列预测 $\Delta \Delta G$ 方面达到了最先进的性能,其准确度对于单个和多个突变均与结构基方法匹配或超过。代码获取:https://github.com/compbiomed-unito/JanusDDG