LLM2D

摘要

arXiv:2505.02566v1 Announce Type: cross 摘要：图神经网络（GNNs）已成为基于图的数据分析的基石，广泛应用于生物信息学、社交网络和推荐系统等领域。然而，在对抗攻击场景如投毒和规避攻击下，模型可解释性和鲁棒性之间的相互影响仍不甚了解。本文提出了一种全面的基准，以系统地分析各种因素对GNNs可解释性的影响，包括增强鲁棒性的防御机制的影响。我们基于GCN、SAGE、GIN和GAT这六种GNN架构，在来自两个不同领域的五个数据集上进行了评估，采用了四种可解释性度量：忠实度、稳定性、一致性和稀疏性。本研究探讨了在模型训练前后应用的防止投毒和规避攻击的防御措施如何影响可解释性，并强调了在鲁棒性和可解释性之间的关键权衡。该框架将作为开源发布。研究结果揭示了根据选择的防御方法和模型架构特性，可解释性存在显著差异。通过建立标准化基准，本工作为开发既对对抗威胁鲁棒又可解释的GNNs奠定了基础，有助于在敏感应用中增强对它们部署的信任。