摘要
arXiv:2505.06049v1 宣告类型: 新
摘要: 摘要:事件序列的总结是数据挖掘的关键方面。大多数现有方法忽略了条件依赖性,仅关注发现序列模式。本文研究了从事件序列数据中发现既条件又无条件依赖性的问题。我们通过发现形如 \(X \rightarrow Y\) 的规则来解决这个问题,其中 \(X\) 和 \(Y\) 是序列模式。这类规则易于理解,并清楚地描述了前提和结果之间的关系。为了发现简明且无重复的规则集,我们从最小描述长度原则的角度形式化了该问题。由于搜索空间巨大且缺乏有帮助的结构,我们提出了Seqret方法以在实践中发现高质量的规则集。通过广泛的实证评估,我们展示了与现有最先进的方法不同,Seqret能够恢复合成数据集中的真实情况,并从真实数据集中发现有用的规则。