LLM2D
从易到难:构建不同隐私图像合成的捷径
From Easy to Hard: Building a Shortcut for Differentially Private Image Synthesis
作者: Kecen Li, Chen Gong, Xiaochen Li, Yuzhong Zhao, Xinwen Hou, Tianhao Wang
发布日期: 4/3/2025
arXiv ID: oai:arXiv.org:2504.01395v1

摘要

arXiv:2504.01395v1 宣告类型: cross 摘要: 差分隐私(DP)图像合成旨在从敏感数据集中生成合成图像,缓解组织在共享和利用合成图像时的隐私泄露担忧。尽管先前的方法在训练差分隐私扰动的扩散模型(DP-SGD)方面取得了显著进展,但它们仍然在性能上不尽如人意。在此项工作中,受教学顺序学习的启发,我们提出了一种两阶段的DP图像合成框架,扩散模型从容易到困难逐步学习生成DP合成图像。与现有方法直接使用DP-SGD训练扩散模型不同,我们提出了在初期阶段的一个容易阶段,扩散模型从敏感图像中学习简单的特征。为了便于这一容易阶段,我们提出了使用`中央图像',即敏感数据集的随机样本的简单聚合。直观上,虽然这些中央图像不显示细节,但它们展示了所有图像的有用特征,并仅导致最小的隐私成本,从而有助于早期阶段的模型训练。我们在四个研究数据集上进行了实验,结果显示,与当前最先进的方法相比,我们合成图像的保真度和实用性指标分别提高了33.1%和2.1%。