摘要
arXiv:2504.19354v1 宣告类型: 新
摘要: 关联规则挖掘(ARM)是挖掘以逻辑规则形式存在的数据特征之间的模式的任务,其应用涉及众多领域。然而,高维数据集往往会产生过多的规则,增加执行时间并对下游任务性能产生负面影响。管理这种规则爆炸仍然是ARM研究中的核心挑战。为了解决这一问题,我们引入了Aerial+,这是一种新颖的神经象征性ARM方法。Aerial+利用一个欠完全的自动编码器来创建数据的神经表示,捕捉特征之间的关联。它通过利用模型的重建机制从这种神经表示中提取规则。在五个数据集上与七个基线进行的广泛评估表明,Aerial+通过学习更简洁、高质量且涵盖完整数据集的规则集,实现了最先进的结果。将Aerial+整合到基于规则的可解释机器学习模型中,显著减少了执行时间,同时保持或提高了准确性。