LLM2D
塔消除偏见:基于塔性质的一种新型不公平性移除方法
TowerDebias: A Novel Unfairness Removal Method Based on the Tower Property
作者: Norman Matloff, Aditya Mittal
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2411.08297v2

摘要

arXiv:2411.08297v2 宣布类型: replace-cross 摘要:决策过程越来越依赖于复杂的机器学习工具,这引发了关于其预测对敏感群体公正性的关键关切。商业“黑盒”模型的广泛采用需要仔细考虑其对消费者的法律和伦理影响。当用户与这样的黑盒模型交互时,一个关键挑战出现了:如何减轻或移除敏感属性(如种族或性别)在其预测中的影响?我们提出了 towerDebias (tDB),一种新颖的后处理方法,旨在减少黑盒模型预测中敏感属性的影响。我们的 tDB 方法利用概率论中的塔特性,可以在不需要重新训练原始模型的情况下改善预测公正性。这种方法极为灵活,因为它不需要了解原始算法的内部结构,并且可以适应多种应用。我们提出了 tDB 的正式公平性改进定理,并通过多个真实世界数据集展示了其在回归和分类任务中的有效性。