LLM2D
机器学习模型成员推断攻击的基本限制
Fundamental Limits of Membership Inference Attacks on Machine Learning Models
作者: Eric Aubinais, Elisabeth Gassiat, Pablo Piantanida
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2310.13786v5

摘要

arXiv:2310.13786v5 通知类型: 替换-交叉 摘要:成员推断攻击(MIA)可以揭示特定数据点是否属于训练数据集,从而可能暴露个人的敏感信息。本文通过探索大规模机器学习模型中MIA的基本统计限制,提供了理论上的保证。更具体地说,我们首先推导出控制此类攻击有效性和成功的统计量。然后,我们理论上证明,在过拟合学习过程的非线性回归设置中,攻击可能有很高的成功率。最后,我们研究了几种情况,并提供了对该感兴趣量的界限。有趣的是,我们的发现表明,对数据进行离散化可能增强学习过程的安全性。这证明了其受一个量化基础数据分布多样性的常数限制。我们通过简单的模拟展示了这些结果。