LLM2D

摘要

arXiv:2408.17253v3 公告类型: replace-cross 摘要：基础模型已成为时间序列预测（TSF）的一个有前途的方法。现有方法不是重新利用大型语言模型（LLMs），就是构建大规模时间序列数据集，以开发适用于通用预测的TSF基础模型。然而，这些方法由于横跨领域的显著差距或领域内的异质性面临挑战。本文探讨了一条新的道路，从丰富的高质量自然图像中构建TSF基础模型。我们的关键洞察是，预训练在ImageNet数据集上的视觉遮蔽自动编码器可以自然地成为数字序列预测器。通过将TSF重新表述为图像重构任务，我们弥合了图像预训练与TSF下游任务之间的差距。令人惊讶的是，在时间序列领域无需进一步适应，所提出的VisionTS在零样本预测性能上优于现有TSF基础模型。通过一个周期的微调，VisionTS可以进一步提高预测性能，并在大多数情况下达到最先进的水平。广泛的实验揭示了图像和真实世界时间序列之间的内在相似性，表明视觉模型可能为TSF提供“免费午餐”，并强调了未来跨模态研究的潜力。我们的代码已在https://github.com/Keytoyze/VisionTS公开。