LLM2D

摘要

arXiv:2502.14704v1 交叉公告类型：时间序列预测摘要：时间序列预测（TSF）在各个领域都是一个关键任务，但现有的TSF模型严重依赖高质量数据，并未能充分利用所有可用数据。本文探索了一种新颖的自监督方法，通过内在构建候选数据集来重新标记时间序列数据集。在简单重建网络的优化过程中，中间结果被用作自监督范式中的伪标签，从而提高任何预测器的泛化能力。我们引入了自校正与自适应掩码（SCAM），该方法丢弃了过拟合的组件，并选择性地用来自重建的伪标签替换它们。此外，我们从损失景观的角度引入了频谱范数正则化（SNR），进一步抑制过拟合。在11个真实世界数据集上的实验表明，SCAM能够一致地提高各种骨干模型的性能。这项工作为通过自监督学习构建数据集和增强TSF模型的泛化能力提供了新的视角。