LLM2D
超越数据稀缺:一种基于频率驱动的零样本预测框架
Beyond Data Scarcity: A Frequency-Driven Framework for Zero-Shot Forecasting
作者: Liran Nochumsohn, Michal Moshkovitz, Orly Avner, Dotan Di Castro, Omri Azencot
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.15743v1

摘要

时间序列预测在许多现实世界应用中至关重要,需要根据观察到的模式准确预测未来的值。虽然传统的预测技术在数据充足的领域内场景中效果良好,但在数据稀缺或根本不可用时却难以奏效,这促使了零样本和少样本学习环境的出现。最近的进展经常利用大型基础模型来完成此类任务,但这些方法需要大量的数据和计算资源,其性能可能会因无法有效地从可用训练集中学习而受到影响。这就提出了一个根本性的问题:哪些因素会影响时间序列预测中从数据中有效学习?为了解决这个问题,我们建议使用傅里叶分析来研究模型如何从合成和现实世界的时间序列数据中学习。我们的研究结果表明,预测模型通常难以有效学习包含多个频率的数据,并且难以泛化到未见过的频率,这阻碍了它们的预测性能。为了缓解这些问题,我们提出了一种新颖的合成数据生成框架,旨在增强真实数据或通过创建特定于任务的频率信息来完全替换真实数据,只需目标数据的采样率即可。我们的方法 Freq-Synth 提高了基础模型和非基础模型在零样本和少样本设置下的鲁棒性,促进了在数据有限的情况下更可靠的时间序列预测。