LLM2D
JanusDDG:一种基于序列的蛋白质稳定性模型,通过两前沿多头注意力实现热力学一致性
JanusDDG: A Thermodynamics-Compliant Model for Sequence-Based Protein Stability via Two-Fronts Multi-Head Attention
作者: Guido Barducci, Ivan Rossi, Francesco Codic\`e, Cesare Rollo, Valeria Repetto, Corrado Pancotti, Virginia Iannibelli, Tiziana Sanavia, Piero Fariselli
发布日期: 4/7/2025
arXiv ID: oai:arXiv.org:2504.03278v1

摘要

arXiv:2504.03278v1 型别: cross 摘要:理解残基变异如何影响蛋白质稳定性对于设计功能性蛋白质和阐明与疾病相关的突变的分子机制至关重要。最近在蛋白质语言模型(PLMs)方面的进展已经彻底改变了计算蛋白质分析,使其能够更准确地预测突变效应。在这项工作中,我们引入了JanusDDG,这是一种深度学习框架,利用PLM提取的嵌入和双向交叉注意变换器架构同时预测单个和多个残基突变的$\Delta \Delta G$,并且受到基本热力学性质,如反对称性和传递性的约束。与传统的自我注意不同,JanusDDG 计算查询(Q)和值(V)为野生型和突变嵌入之间的差值,而键(K)交替使用两者。这种交叉交错的注意机制使模型能够捕捉突变引起的扰动,同时保留重要的上下文信息。实验结果表明,JanusDDG 在仅从序列预测 $\Delta \Delta G$ 方面达到了最先进的性能,并且在单个和多个突变方面均与基于结构的方法具有相同的或更高的准确性。