LLM2D

摘要

arXiv:2504.05125v1 类型: cross 摘要: 聚类是一种高效且必不可少的技术，用于探索数据的潜在知识。然而，对于大多数聚类算法检测到的聚类的解释性给予了有限的关注。此外，由于数据的同质性，不同的数据组具有自己的同质风格。在本文中，考虑了上述两个方面，并提出了一种可解释的Takagi-Sugeno-Kang (TSK) 模糊聚类(IS-TSK-FC)算法。IS-TSK-FC的聚类行为完全由TSK模糊推理在模糊规则上的推理引导。特别地，样本根据所有通过无监督学习方式学习的模糊规则对应的结果向量进行分组。这可以详细解释聚类是如何生成的，从而使得IS-TSK-FC的潜在决策过程变得可解释。此外，在IS-TSK-FC中引入了一系列风格矩阵，以通过捕捉聚类的风格以及不同风格之间的细微差别来辅助模糊规则的结果。因此，IS-TSK-FC中的所有模糊规则都有强大的数据表示能力。在确定所有模糊规则的先行量后，IS-TSK-FC的优化问题可以通过交替方式迭代求解。通过在基准数据集上进行广泛的实验来验证IS-TSK-FC作为可解释聚类工具的有效性，该基准数据集包含未知的显式/隐式风格。尤其是，在不同组数据呈现显式风格的情况下，IS-TSK-FC的聚类性能在案例研究中得到了展示。IS-TSK-FC的源代码可以从 https://github.com/gusuhang10/IS-TSK-FC 下载。