LLM2D

摘要

arXiv:2503.19070v1 安全性类型：交叉摘要：图神经网络（GNNs）广泛用于图结构数据，但在图分类任务中容易受到成员 inference 攻击（MIAs）的影响，这些攻击可以确定一个图是否是训练数据集的一部分，可能造成数据泄漏。现有的 MIAs 依赖于预测概率向量，但在仅使用预测标签时，它们就变得无效。我们提出了一种基于目标模型对训练数据和测试数据的预测稳定性差异的图级标签唯一成员 inference 攻击（GLO-MIA）。GLO-MIA 通过对目标图的有效特征添加扰动生成一组扰动图，并通过查询目标模型获取这些扰动图的预测标签，然后利用这些标签计算目标图的鲁棒性分数。最后，通过将鲁棒性分数与预定义的阈值进行比较，可以以高概率正确推断目标图的成员身份。在三个数据集和四种 GNN 模型上的评估显示，GLO-MIA 的攻击准确率达到了 0.825，比基线工作高出 8.5%，并且即使仅使用预测标签，其性能也几乎与基于概率的 MIAs 相当。