摘要
arXiv:2407.14766v2 通知类型: 替换-交叉
摘要:在这篇文章中,我们提出了一项关于AI分类公平性问题的哲学和实验性研究。我们认为,在AI分类中实现公平性不仅仅是操作性地实现公平性指标那么简单,还需要建立所选择分类模型及其背后原则的可解释性。具体来说,这包括让训练过程透明化,确定公平性标准实际上产生的结果,以及通过与可能产生不同结果的紧密相关模型进行比较来评估它们的权衡。为了说明这种方法,我们训练了一个模型并开发了一个用于差异检测和公平干预的工具包FairDream。尽管FairDream旨在强制实施人口均衡性,实验表明它满足了相等概率的结果约束。因此,该算法比用户预期的更为保守。为了证明这一结果,我们首先澄清了人口均衡性和相等概率作为公平性标准的关系。然后,我们解释了FairDream的加权方法,并通过与紧密相关模型的基准比较来证明FairDream所达成的权衡。我们得出了关于这些解释性步骤如何使AI模型值得信赖的结论。