LLM2D
利用数据指纹进行时间序列分类中的隐私保护算法选择:对未知数据集的性能和不确定性估计
Utilizing Data Fingerprints for Privacy-Preserving Algorithm Selection in Time Series Classification: Performance and Uncertainty Estimation on Unseen Datasets
作者: Lars B\"ocking, Leopold M\"uller, Niklas K\"uhl
发布日期: 10/2/2024
arXiv ID: oai:arXiv.org:2409.08636v2

摘要

在设计面向现实世界时间序列分类用例的 AI 服务时,算法选择是一个至关重要的步骤。传统的算法选择方法,如神经网络架构搜索、自动机器学习、组合算法选择和超参数优化,虽然有效,但需要大量的计算资源,并且需要访问所有数据点才能执行优化。本文介绍了一种新颖的数据指纹,它以隐私保护的方式描述任何时间序列分类数据集,并在无需对(未见)数据集进行训练的情况下,为算法选择问题提供洞察。通过分解多目标回归问题,仅使用我们的数据指纹以可扩展和自适应的方式估计算法性能和不确定性。我们在加州大学河滨分校的 112 个基准数据集上评估了我们的方法,证明了其在预测 35 种最先进算法性能方面的有效性,并为时间序列分类服务系统中的有效算法选择提供了宝贵的见解,平均提高了 7.32% 的平均性能估计和 15.81% 的不确定性估计,优于朴素基线。