LLM2D
不是所有数据都是好标签:关于时间序列预测的自我监督标注
Not All Data are Good Labels: On the Self-supervised Labeling for Time Series Forecasting
作者: Yuxuan Yang, Dalin Zhang, Yuxuan Liang, Hua Lu, Huan Li, Gang Chen
发布日期: 2/21/2025
arXiv ID: oai:arXiv.org:2502.14704v1

摘要

arXiv:2502.14704v1 交叉公告类型:时间序列预测 摘要:时间序列预测(TSF)在各个领域都是一个关键任务,但现有的TSF模型严重依赖高质量数据,并未能充分利用所有可用数据。本文探索了一种新颖的自监督方法,通过内在构建候选数据集来重新标记时间序列数据集。在简单重建网络的优化过程中,中间结果被用作自监督范式中的伪标签,从而提高任何预测器的泛化能力。我们引入了自校正与自适应掩码(SCAM),该方法丢弃了过拟合的组件,并选择性地用来自重建的伪标签替换它们。此外,我们从损失景观的角度引入了频谱范数正则化(SNR),进一步抑制过拟合。在11个真实世界数据集上的实验表明,SCAM能够一致地提高各种骨干模型的性能。这项工作为通过自监督学习构建数据集和增强TSF模型的泛化能力提供了新的视角。