LLM2D
SCMPPI:监督对比多模态框架用于预测蛋白质-蛋白质相互作用
SCMPPI: Supervised Contrastive Multimodal Framework for Predicting Protein-Protein Interactions
作者: Shengrui XU, Tianchi Lu, Zikun Wang, Jixiu Zhai, Jingwan Wang
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2504.02698v1

摘要

arXiv:2504.02698v1 Announce Type: cross 摘要:蛋白质-蛋白质相互作用(PPI)预测是揭示细胞功能网络和疾病机制的关键任务。然而,传统的实验方法耗时且成本高,现有的计算模型在跨模态特征融合、鲁棒性和抑制假阴性方面也面临挑战。本文中,我们提出了一种新颖的监督对比多模态框架SCMPPI,用于PPI预测。通过将蛋白质序列特征(AAC,DPC,CKSAAP-ESMC)与PPI网络拓扑信息(Node2Vec图嵌入)相结合,并结合改进的监督对比学习策略,SCMPPI显著增强了PPI预测性能。对于PPI任务,SCMPPI引入了一种负样本过滤机制并修改了对比损失函数,有效优化了多模态特征。在包括酵母、人类和H. pylori在内的八个基准数据集上进行的实验表明,SCMPPI在准确率(98.01%)和AUC(99.62%)等关键指标上优于现有最先进的方法(如DF-PPI和TAGPPI),并且在跨物种预测中展现出强大的泛化能力(多物种数据集上的AUC > 99%)。此外,SCMPPI已成功应用于CD9网络、Wnt信号通路以及癌症特异性网络,提供了一种可靠的疾病靶点发现工具。该框架还为在多种联合预测中进行协作优化时的多模态生物信息融合和对比学习提供了新的范式。