摘要
随着大型图学习模型的趋势,企业主倾向于使用第三方提供的模型来为用户提供商业服务。然而,这些模型可能存在后门,恶意用户可以提交嵌入触发器的输入来操纵模型预测。现有的图后门防御存在几个局限性:1)依赖于模型相关细节,2)需要额外的模型微调,3)依赖于额外的可解释性工具,所有这些在严格的隐私政策下都是不可行的。为了解决这些局限性,我们提出了 GraphProt,它允许资源受限的企业主依赖第三方来避免对基于 GNN 的图分类器的后门攻击。我们的 GraphProt 与模型无关,只依赖于输入图。关键的见解是利用子图信息进行预测,从而减轻触发器引起的後門效应。GraphProt 包含两个部分:基于聚类的触发器消除和鲁棒子图集成。具体来说,我们首先提出特征拓扑聚类,旨在消除大多数异常子图(触发器)。此外,我们根据特征拓扑聚类设计子图采样策略,通过多数投票构建鲁棒分类器。在三种后门攻击和六个基准数据集上的实验结果表明,GraphProt 显着降低了后门攻击成功率,同时保留了模型在常规图分类任务上的准确性。