LLM2D
通过数据复杂性发现公平性作为一种早期指标
Uncovering Fairness through Data Complexity as an Early Indicator
作者: Juliett Su\'arez Ferreira, Marija Slavkovik, Jorge Casillas
发布日期: 4/9/2025
arXiv ID: oai:arXiv.org:2504.05923v1

摘要

arXiv:2504.05923v1 类别: 交叉学科 摘要:公平性是机器学习(ML)应用中的一个关注点。目前,还没有研究探讨分类复杂度在特权和非特权群体之间差异如何影响解决方案的公平性,这可以作为潜在不公平性的一个初步指标。在本文中,我们调查了这一差距,具体来说,我们关注的是设计用于捕捉各种偏差(包括历史偏差、测量偏差和表示偏差)的合成数据集,以评估各种复杂度度量差异与群体公平性度量之间的关联。然后,我们应用关联规则挖掘来识别将群体间不成比例的复杂度差异与与公平性相关的结果联系起来的模式,为偏见缓解提供数据为中心的指标。我们的发现还通过在实际问题中的应用得到了验证,提供了量化群体间分类复杂度可以揭示潜在公平性挑战早期指标的证据。这项调查帮助从业者主动解决分类任务中的偏见问题。