LLM2D
SDC-HSDD-NDSA:基于分层次方向差分的结构检测聚类,带规范化密度和自适应性
SDC-HSDD-NDSA: Structure Detecting Cluster by Hierarchical Secondary Directed Differential with Normalized Density and Self-Adaption
作者: Hao Shu
发布日期: 2/17/2025
arXiv ID: oai:arXiv.org:2307.00677v5

摘要

arXiv:2307.00677v5 宣告类型: replace-cross 摘要:基于密度的聚类算法自它能够识别由低密度区域分隔的任意形状的聚类以来一直是最流行的聚类算法。然而,一个未被低密度区域分割的高密度区域可能包含属于多个聚类的不同结构。据我们所知,所有之前基于密度的聚类算法都无法检测到这种结构。在本文中,我们提供了一种新的基于密度的聚类方案来解决这一问题。这是首个能够检测未被低密度区域分割的高密度区域中细致结构的聚类算法,从而扩展了聚类的应用范围。该算法采用二级导向差分、层次结构、标准化密度,以及自适应系数,称为基于标准化密度和自适应机制的二级导向差分与层次结构聚类方案,简称 SDC-HSDD-NDSA。我们在合成数据集和真实数据集上进行了实验,以验证该算法的有效性、鲁棒性以及粒度无关性,并将该方案与 Python 包 Scikit-learn 中的无监督算法进行了比较。结果表明,在多种情况下,我们的算法优于之前的算法,尤其是在聚类内部具有规则结构的情况下表现尤为显著。例如,在使用ARI和NMI标准评估的八个无噪声合成数据集结构中,之前的算法得分低于0.6和0.7,而提出的算法得分分别高于0.9和0.95。