摘要
arXiv:2505.06259v1 公平聚类类型:跨领域
摘要:由于集群方法在现实世界中的广泛应用,其公平性已成为主要关注点。公平聚类的理论结果表明,公平性具有传递性:给定一组小且公平的聚类,基于中心点的简单聚类算法可以产生公平的聚类。不幸的是,发现合适的初始聚类可能是计算上昂贵的、复杂的或任意的。
本文中,我们提出了基于 \emph{clusterlet} 的简单模糊聚类算法,这些算法可以匹配单一类别的聚类,并优化公平聚类。匹配利用了 clusterlet 距离,不仅优化了经典的聚类目标,还正则化了公平性。实验证明,简单的匹配策略能够实现高度的公平性,并且适当的参数调整能够实现高凝聚力和低重叠。