LLM2D

摘要

arXiv:2504.21634v1 类别: cross 摘要：AI系统的公正性审计可以识别和量化偏差。然而，使用真实数据的传统审计会引发安全和隐私问题。审计人员会成为敏感信息的保管人，并成为网络攻击的目标，这会给他们带来安全风险。即使没有直接的数据泄露，数据分析也可能无意中暴露机密信息，从而引发隐私风险。为了解决这些问题，我们提出了一种框架，利用差异隐私合成数据来审计AI系统的公正性。通过应用隐私保护机制，该方法生成的合成数据在统计特性上与原始数据集相似，同时保证隐私。该方法平衡了严格的公正性审计目标和强大隐私保护的需求。通过对Adult、COMPAS和糖尿病等真实数据集进行实验，我们比较了合成数据和真实数据的公正性指标。通过分析这些指标之间的契合度和差异性，我们评估了合成数据保护真实数据公平性属性的能力。我们的结果证明了该框架能够实现有意义的公平性评估，同时保护敏感信息，证明了其在关键和敏感领域的适用性。