摘要
arXiv:2310.13786v5 通知类型: 替换-交叉
摘要:成员推断攻击(MIA)可以揭示特定数据点是否属于训练数据集,从而可能暴露个人的敏感信息。本文通过探索大规模机器学习模型中MIA的基本统计限制,提供了理论上的保证。更具体地说,我们首先推导出控制此类攻击有效性和成功的统计量。然后,我们理论上证明,在过拟合学习过程的非线性回归设置中,攻击可能有很高的成功率。最后,我们研究了几种情况,并提供了对该感兴趣量的界限。有趣的是,我们的发现表明,对数据进行离散化可能增强学习过程的安全性。这证明了其受一个量化基础数据分布多样性的常数限制。我们通过简单的模拟展示了这些结果。