摘要
arXiv:2504.18329v1 类型: cross
摘要: 在数据复杂性和高维度性的背景下,多变量时间序列分类在平衡性能和可解释性方面面临着重大挑战。本文介绍了一种结合持久同调和层理论的方法——PHeatPruner,以解决这些挑战。持久同调使我们能够在保持或提升随机森林、CatBoost、XGBoost 和 LightGBM 等模型的准确性的前提下,修剪多达45%的应用变量,同时无需依赖后验概率或监督优化算法。同时,层理论提供了解释向量,提供关于数据结构细微差别的更深入见解。该方法使用UEA档案和奶牛乳腺炎检测数据集进行了验证。结果表明,PHeatPruner 有效地保持了模型准确性。此外,我们的结果突显了PHeatPruner 的关键功能,即简化复杂数据并提供可操作的见解,而不增加处理时间和复杂性。该方法填补了复杂性降低和可解释性之间的差距,表明其在各个领域的潜在应用前景。