LLM2D

摘要

arXiv:2505.01652v1 宣布类型:跨学科摘要：公平的机器学习旨在识别和减轻以人口统计属性（如种族和性别）为特征的不利人群在预测中的偏见。最近，一些工作将公平性扩展到图数据，如社交网络，但大多数工作忽略了数据实例之间的因果关系。本文解决了公平感知机器学习算法中普遍存在的挑战，这些算法通常假设数据是独立同分布（IID）的。我们针对数据实例相互连接，影响公平干预结果的非IID、图基设置进行了研究。我们基于网络结构因果模型（NSCM）框架，并提出两个主要假设：可分解性和图独立性，这些假设使得在非IID设置下使用do-因果运算符计算干预分布成为可能。基于这些假设，我们开发了因果推理消息传递变分自编码器（MPVA），以计算干预分布并利用估计的干预分布实现因果公平节点分类。在半合成数据集和真实世界数据集上的实证评估表明，MPVA通过有效近似干预分布并减轻偏见，在性能上优于传统方法。我们的研究发现的含义突显了因果公平在复杂机器学习应用中的潜力，并为进一步研究放宽初始假设以增强模型公平性开辟了前景。