摘要
arXiv:2403.13846v3 宣传类型: 更新-交叉
摘要:基于图模型的聚类方法因其在各个知识领域的广泛应用而受到越来越多的关注。基于图模型的聚类分析能够无缝集成到其他相关应用中,使得其能够在数据集中稳健地提取“自然关联”或“图结构”,有助于数据点之间关系的建模。尽管具有有效性,但当前利用图模型的聚类方法忽视了节点之间随机游走访问相关的不确定性以及数据中嵌入的结构信息。为解决这一问题,我们提出了一种新颖的基于图模型的最大化解码信息的聚类方法,命名为CMDI。CMDI创新地将二维结构信息理论融入到聚类过程中,包括两个阶段:图结构提取和图顶点分区。在CMDI中,图分区被重新表述为一个抽象的聚类问题,利用最大化解码信息来最小化随机访问顶点相关的不确定性。在三个真实数据集上的实验证明,CMDI优于经典的基线方法,显示了更高的解码信息比(DI-R)。此外,CMDI展示了更高的效率,特别是在考虑先验知识(PK)的情况下。这些发现强调了CMDI在提高解码信息质量和计算效率方面的有效性,使其成为图模型聚类分析中的一个有价值工具。