LLM2D

摘要

在这项工作中，我们系统地探讨了机器学习系统中数据集剪枝的数据隐私问题。我们的研究结果首次揭示，即使冗余集中的数据仅在模型训练之前使用，其剪枝阶段的成员身份仍然可以通过攻击被检测到。由于这是一个完全位于模型训练之前的上游过程，传统的基于模型输出的隐私推断方法完全不适用。为了解决这个问题，我们引入了一个名为数据中心成员推断的新任务，并提出了第一个数据中心隐私推断范式，称为数据血统推断 (DaLI)。在这个范式下，提出了四种基于阈值的攻击方法，分别命名为 WhoDis、CumDis、ArraDis 和 SpiDis。我们表明，即使没有访问下游模型，对手也可以仅凭有限的先验知识准确识别冗余集。此外，我们发现不同的剪枝方法涉及不同程度的隐私泄露，即使是相同的剪枝方法在不同的剪枝比例下也可能存在不同的隐私风险。我们对这些现象进行了深入分析，并引入了一个名为“充盈分数”的指标，为选择具有隐私保护功能的剪枝方法提供指导。