LLM2D

摘要

arXiv:2504.18497v1 交叉公告类型摘要：经验性推断攻击是评估数据发布机制在实践中隐私风险的一种流行方法。尽管存在评估机器学习模型或合成数据发布的主动攻击方法，但目前我们缺乏对固定汇总统计的可比方法，特别是在仅发布有限数量的统计信息时。我们在此提出了针对固定汇总统计的推断攻击框架和属性推断攻击DeSIA。我们实例化DeSIA针对美国人口普查PPMF数据集，并且表明其在重建攻击的基础上表现出非常显著的优势。尤其是，我们展示了DeSIA在低误报率（10^-3）的情况下能够有效识别易受攻击的用户，真阳性率为0.14。然后我们展示了DeSIA在用户属性无法验证、聚合统计数量变化以及噪声添加程度变化的情况下也能很好地工作。我们还进行了DeSIA的广泛消融研究，并展示了如何使DeSIA成功适应成员推断任务。总体而言，我们的结果表明，单靠聚合并不能在发布相对较少的聚合统计时保护隐私，并强调在发布汇总统计之前需要正式的隐私机制和测试的重要性。