摘要
arXiv:2504.21289v1 交叉类型: biclustering
摘要:共聚类是一种在数据挖掘和模式识别中有效的方法。当处理高维数据时,基于传统聚类的共聚类算法面临两个根本性的局限性:(1) 高维空间中的距离集中现象导致数据稀疏,使相似性度量无效;(2) 主流的线性降维方法破坏了关键的局部结构模式。为了将共聚类应用于高维数据集,我们提出了一种基于正交因子的共聚类算法(BCBOF)。首先,我们在高维数据集的向量空间中构建了正交因子,然后,我们使用原始数据在正交子空间中的坐标作为聚类目标进行聚类。最后,我们得到了原始数据集的共聚类结果。由于在聚类之前进行了降维,所提出算法有效地缓解了由于高维数据导致的数据稀疏问题。此外,我们将该共聚类算法应用于股票技术指标组合及股票价格趋势预测。将共聚类结果转换为模糊规则,并将收益保护和止损规则纳入规则集,最终形成一个用于股票价格趋势预测和交易信号的模糊推理系统。为了评估BCBOF的性能,我们使用多种评估指标与现有的共聚类方法进行了比较。结果显示,我们的算法优于其他共聚类技术。为了验证模糊推理系统的有效性,我们使用10只A股历史数据进行了虚拟交易实验。实验结果表明,生成的交易策略为投资者带来了更高的收益。