LLM2D

摘要

针对多个私有数据孤岛上的联邦查询处理，选择合适的隐私保护机制是一个挑战。现有的隐私保护机制包括安全多方计算 (SMC)、带有差分隐私 (DP) 的近似查询处理、SMC 和 DP 的结合、基于 DP 的数据混淆以及联邦学习。这些机制在准确性、隐私、执行效率和存储效率之间做出了不同的权衡。在这项工作中，我们首先介绍了一种新的隐私保护技术，该技术使用经过差分隐私随机梯度下降 (DP-SGD) 算法训练的深度学习模型来替换实际数据的一部分以回答查询。然后，我们展示了一种新颖的声明式隐私保护工作流，它允许用户指定“要保护哪些私人信息”，而不是“如何保护”。在后台，系统依赖于成本模型来自动选择隐私保护机制以及超参数。同时，所提出的工作流还允许人类专家审查和调整所选的隐私保护机制，以用于审计/合规和优化目的。