摘要
开发具有稳健群体公平特性的模型至关重要,尤其是在医疗诊断等伦理敏感领域。近年来,在机器学习中实现公平性的方法需要大量的训练数据,并且依赖于模型重新训练,这在现实场景中可能不切实际。为了缓解这些挑战,我们提出了基于偏差的权重掩蔽微调 (BMFT),这是一种新颖的后处理方法,可以在显著减少的训练周期内提高已训练模型的公平性,而无需访问原始训练数据。BMFT 在模型参数上生成一个掩码,该掩码可以有效地识别对偏差预测贡献最大的权重。此外,我们提出了一种两步去偏策略,其中特征提取器在识别出的偏差影响权重上进行初始微调,随后在重新初始化的分类层上进行微调以维持判别性能。在四个皮肤病数据集和两个敏感属性上的大量实验表明,BMFT 在诊断准确性和公平性指标方面均优于现有的最先进 (SOTA) 技术。我们的发现强调了 BMFT 在推进各种非分布 (OOD) 设置中的公平性方面的有效性和稳健性。我们的代码可在以下地址获得:https://github.com/vios-s/BMFT