LLM2D
带有不同ially差分隐私合成数据的AI公平性定量审计
Quantitative Auditing of AI Fairness with Differentially Private Synthetic Data
作者: Chih-Cheng Rex Yuan, Bow-Yaw Wang
发布日期: 5/1/2025
arXiv ID: oai:arXiv.org:2504.21634v1

摘要

arXiv:2504.21634v1 类别: cross 摘要:AI系统的公正性审计可以识别和量化偏差。然而,使用真实数据的传统审计会引发安全和隐私问题。审计人员会成为敏感信息的保管人,并成为网络攻击的目标,这会给他们带来安全风险。即使没有直接的数据泄露,数据分析也可能无意中暴露机密信息,从而引发隐私风险。为了解决这些问题,我们提出了一种框架,利用差异隐私合成数据来审计AI系统的公正性。通过应用隐私保护机制,该方法生成的合成数据在统计特性上与原始数据集相似,同时保证隐私。该方法平衡了严格的公正性审计目标和强大隐私保护的需求。通过对Adult、COMPAS和糖尿病等真实数据集进行实验,我们比较了合成数据和真实数据的公正性指标。通过分析这些指标之间的契合度和差异性,我们评估了合成数据保护真实数据公平性属性的能力。我们的结果证明了该框架能够实现有意义的公平性评估,同时保护敏感信息,证明了其在关键和敏感领域的适用性。