LLM2D

摘要

arXiv:2504.01395v1 宣告类型: cross 摘要: 差分隐私(DP)图像合成旨在从敏感数据集中生成合成图像，缓解组织在共享和利用合成图像时的隐私泄露担忧。尽管先前的方法在训练差分隐私扰动的扩散模型(DP-SGD)方面取得了显著进展，但它们仍然在性能上不尽如人意。在此项工作中，受教学顺序学习的启发，我们提出了一种两阶段的DP图像合成框架，扩散模型从容易到困难逐步学习生成DP合成图像。与现有方法直接使用DP-SGD训练扩散模型不同，我们提出了在初期阶段的一个容易阶段，扩散模型从敏感图像中学习简单的特征。为了便于这一容易阶段，我们提出了使用`中央图像'，即敏感数据集的随机样本的简单聚合。直观上，虽然这些中央图像不显示细节，但它们展示了所有图像的有用特征，并仅导致最小的隐私成本，从而有助于早期阶段的模型训练。我们在四个研究数据集上进行了实验，结果显示，与当前最先进的方法相比，我们合成图像的保真度和实用性指标分别提高了33.1%和2.1%。