LLM2D

摘要

受自然语言处理 (NLP) 中大型语言模型 (LLM) 的最新进展启发，人们对开发用于时间序列预测的基础模型的研究兴趣激增。一种方法是使用交叉熵损失对标记化的时间序列数据训练 LLM 架构。尽管这种方法已经展现出令人鼓舞的结果，但交叉熵损失主要用于分类任务，并未考虑类别之间的距离。为了解决这一限制，我们建议在这种架构中使用 Wasserstein 损失。为了验证我们的方法，我们在 $22$ 个零样本数据集上微调了一个基础时间序列模型，比较了交叉熵损失与 Wasserstein 损失的性能。我们的结果表明，用 Wasserstein 损失替换交叉熵损失显着提高了点估计。