LLM2D
为了正确的公平性:使用显著性图评估神经网络中的偏见去除
Towards Fairness for the Right Reasons: Using Saliency Maps to Evaluate Bias Removal in Neural Networks
作者: Lukasz Sztukiewicz, Ignacy St\k{e}pka, Micha{\l} Wili\'nski, Jerzy Stefanowski
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2503.00234v2

摘要

arXiv:2503.00234v2 宣布类型: replace-cross 摘要:机器学习系统的广泛应用引发了对公平性和偏见的重大关注,这使得减轻有害偏见成为了AI开发的必要条件。在本文中,我们研究了公平性提升与计算机视觉任务中神经网络中的有害偏见去除之间的关系。首先,我们介绍了一组新颖的基于XAI的度量标准,通过分析显著性图来评估模型决策过程中的变化。然后,我们证明了成功的去偏方法系统地将模型的重点从受保护属性转移到其他方面。此外,我们展示了最初为去伪结构开发的技术可以有效地重新用于提高公平性。这些发现强调了确保模型出于正确的原因进行公平性的重要性,有助于开发更具伦理性和可信度的AI系统。