LLM2D

摘要

为了构建可信赖的 AI，生成模型必须确保隐私和公平性。虽然这两个目标通常被分别追求，但最近的研究提出将现有的隐私和公平技术结合起来以实现这两个目标。然而，简单地将这些技术结合起来可能不足，因为隐私和公平之间存在冲突，即少数群体中的样本可能为了公平而被放大，但为了隐私而被抑制。我们证明了这些冲突会导致不利影响，例如隐私侵犯和意想不到的公平性-效用权衡。为了减轻这些风险，我们提出了 PFGuard，这是一个具有隐私和公平保障的生成框架，它同时解决了隐私、公平性和效用问题。通过使用多个教师模型的集成，PFGuard 在公平训练阶段和隐私训练阶段之间平衡了隐私-公平冲突，并基于集成学习实现了高效用。大量的实验表明，PFGuard 成功地生成了高维数据的合成数据，同时提供了公平收敛和严格的 DP 保证——据我们所知，这是第一个此类框架。