LLM2D

摘要

开发具有稳健群体公平特性的模型至关重要，尤其是在医疗诊断等伦理敏感领域。近年来，在机器学习中实现公平性的方法需要大量的训练数据，并且依赖于模型重新训练，这在现实场景中可能不切实际。为了缓解这些挑战，我们提出了基于偏差的权重掩蔽微调 (BMFT)，这是一种新颖的后处理方法，可以在显著减少的训练周期内提高已训练模型的公平性，而无需访问原始训练数据。BMFT 在模型参数上生成一个掩码，该掩码可以有效地识别对偏差预测贡献最大的权重。此外，我们提出了一种两步去偏策略，其中特征提取器在识别出的偏差影响权重上进行初始微调，随后在重新初始化的分类层上进行微调以维持判别性能。在四个皮肤病数据集和两个敏感属性上的大量实验表明，BMFT 在诊断准确性和公平性指标方面均优于现有的最先进 (SOTA) 技术。我们的发现强调了 BMFT 在推进各种非分布 (OOD) 设置中的公平性方面的有效性和稳健性。我们的代码可在以下地址获得：https://github.com/vios-s/BMFT