摘要
arXiv:2505.09295v1 类型: 交叉
摘要:在医疗保健等高风险领域应用人工智能时,确保公平性至关重要,因为这些领域中的预测模型可能会在不平衡且统计特征偏斜的数据上进行训练,进而加剧现有的不平等。联邦学习(FL)能够在不侵犯隐私的情况下促进机构间的合作,但仍然容易受到算法偏见和子组不平衡的影响,尤其是在多种敏感属性相交的情况下。我们提出了一种名为 FedIDA(面向不平衡和差异感知的联邦学习)的一般框架,该框架结合了公平性意识正则化与组条件过采样。FedIDA 在不改变底层 FL 算法收敛行为的情况下支持多个敏感属性和异质数据分布。我们通过利普希茨连续性和集中不等式提供了理论分析,确立了公平性改进的界限,并证明了 FedIDA 可以降低公平性指标在测试集上的方差。在基准数据集和真实世界临床数据集上的实验结果证实了 FedIDA 可以一致地提高公平性同时保持竞争力的预测性能,展示了其在医疗保健中实现公平和隐私保护建模的有效性。相关源代码可在 GitHub 上获取。