LLM2D

摘要

识别与抗原肽相互作用的T细胞受体(TCR)为疫苗和免疫疗法的开发提供了技术基础。新兴的深度学习方法擅长从已知的TCR中学习抗原结合模式，但在处理新的或稀疏表示的抗原时却难以奏效。然而，针对未见抗原或外源肽的结合特异性至关重要。我们引入了一种领域自适应的肽不可知学习框架DapPep，用于通用TCR-抗原结合亲和力预测，以应对这一挑战。轻量级的自注意力架构将预训练的蛋白质语言模型与内部循环自监督机制相结合，从而实现稳健的TCR-肽表征。在各种基准上的大量实验表明，DapPep始终优于现有工具，展现出强大的泛化能力，尤其是在数据稀缺的环境和未见肽方面。此外，DapPep在具有挑战性的临床任务中也证明了其有效性，例如在肿瘤新抗原疗法中对反应性T细胞进行分选以及识别3D结构中的关键位置。