LLM2D

摘要

随着大型图学习模型的趋势，企业主倾向于使用第三方提供的模型来为用户提供商业服务。然而，这些模型可能存在后门，恶意用户可以提交嵌入触发器的输入来操纵模型预测。现有的图后门防御存在几个局限性：1）依赖于模型相关细节，2）需要额外的模型微调，3）依赖于额外的可解释性工具，所有这些在严格的隐私政策下都是不可行的。为了解决这些局限性，我们提出了 GraphProt，它允许资源受限的企业主依赖第三方来避免对基于 GNN 的图分类器的后门攻击。我们的 GraphProt 与模型无关，只依赖于输入图。关键的见解是利用子图信息进行预测，从而减轻触发器引起的後門效应。GraphProt 包含两个部分：基于聚类的触发器消除和鲁棒子图集成。具体来说，我们首先提出特征拓扑聚类，旨在消除大多数异常子图（触发器）。此外，我们根据特征拓扑聚类设计子图采样策略，通过多数投票构建鲁棒分类器。在三种后门攻击和六个基准数据集上的实验结果表明，GraphProt 显着降低了后门攻击成功率，同时保留了模型在常规图分类任务上的准确性。