LLM2D
数据聚类中的成对相似性转换
Shift of Pairwise Similarities for Data Clustering
作者: Morteza Haghir Chehreghani
发布日期: 2/6/2025
arXiv ID: oai:arXiv.org:2110.13103v3

摘要

arXiv:2110.13103v3 公告类型: replace-cross 摘要:几种聚类方法(例如,归一化切分和比率切分)通过除以与聚类相关的因子(例如,聚类的大小或度)来划分最小切分代价函数,以此来获得更均衡的划分。与此相反,我们研究将这种正则化添加到原始代价函数中。我们首先考虑正则化项是聚类大小平方和的情况,然后将其推广到对等相似性的自适应正则化。这导致了对对等相似性的自适应调整,可能会使其中的一些变为负值。然后,我们研究了这种方法与相关聚类的联系,并提出了一个高效的局部搜索优化算法,该算法具有快速的理论收敛率以解决新的聚类问题。接下来,我们在一些常见的聚类方法中研究了对等相似性的调整,并通过在不同数据集上的广泛实验展示了该方法的优越性能。