LLM2D
基于 Wasserstein 损失的时序基础模型微调
Fine-Tuning a Time Series Foundation Model with Wasserstein Loss
发布日期: 9/25/2024
arXiv ID: oai:arXiv.org:2409.15367v1

摘要

受自然语言处理 (NLP) 中大型语言模型 (LLM) 的最新进展启发,人们对开发用于时间序列预测的基础模型的研究兴趣激增。一种方法是使用交叉熵损失对标记化的时间序列数据训练 LLM 架构。尽管这种方法已经展现出令人鼓舞的结果,但交叉熵损失主要用于分类任务,并未考虑类别之间的距离。为了解决这一限制,我们建议在这种架构中使用 Wasserstein 损失。为了验证我们的方法,我们在 $22$ 个零样本数据集上微调了一个基础时间序列模型,比较了交叉熵损失与 Wasserstein 损失的性能。我们的结果表明,用 Wasserstein 损失替换交叉熵损失显着提高了点估计。