摘要
arXiv:2110.13103v3 公告类型: replace-cross
摘要:几种聚类方法(例如,归一化切分和比率切分)通过除以与聚类相关的因子(例如,聚类的大小或度)来划分最小切分代价函数,以此来获得更均衡的划分。与此相反,我们研究将这种正则化添加到原始代价函数中。我们首先考虑正则化项是聚类大小平方和的情况,然后将其推广到对等相似性的自适应正则化。这导致了对对等相似性的自适应调整,可能会使其中的一些变为负值。然后,我们研究了这种方法与相关聚类的联系,并提出了一个高效的局部搜索优化算法,该算法具有快速的理论收敛率以解决新的聚类问题。接下来,我们在一些常见的聚类方法中研究了对等相似性的调整,并通过在不同数据集上的广泛实验展示了该方法的优越性能。