LLM2D

摘要

arXiv:2310.13786v5 通知类型: 替换-交叉摘要：成员推断攻击（MIA）可以揭示特定数据点是否属于训练数据集，从而可能暴露个人的敏感信息。本文通过探索大规模机器学习模型中MIA的基本统计限制，提供了理论上的保证。更具体地说，我们首先推导出控制此类攻击有效性和成功的统计量。然后，我们理论上证明，在过拟合学习过程的非线性回归设置中，攻击可能有很高的成功率。最后，我们研究了几种情况，并提供了对该感兴趣量的界限。有趣的是，我们的发现表明，对数据进行离散化可能增强学习过程的安全性。这证明了其受一个量化基础数据分布多样性的常数限制。我们通过简单的模拟展示了这些结果。