LLM2D

摘要

arXiv:2411.08297v2 宣布类型: replace-cross 摘要：决策过程越来越依赖于复杂的机器学习工具，这引发了关于其预测对敏感群体公正性的关键关切。商业“黑盒”模型的广泛采用需要仔细考虑其对消费者的法律和伦理影响。当用户与这样的黑盒模型交互时，一个关键挑战出现了：如何减轻或移除敏感属性（如种族或性别）在其预测中的影响？我们提出了 towerDebias (tDB)，一种新颖的后处理方法，旨在减少黑盒模型预测中敏感属性的影响。我们的 tDB 方法利用概率论中的塔特性，可以在不需要重新训练原始模型的情况下改善预测公正性。这种方法极为灵活，因为它不需要了解原始算法的内部结构，并且可以适应多种应用。我们提出了 tDB 的正式公平性改进定理，并通过多个真实世界数据集展示了其在回归和分类任务中的有效性。