摘要
arXiv:2502.00059v1 类别: cross
摘要: 大型语言模型(LLMs)在时间序列分析中已被广泛运用。然而,在涉及多变量时间序列数据的少量样本分类(即由于工业应用中可用训练数据有限而成为一个关键的训练场景)方面的实用性仍待探索。我们旨在利用LLMs中丰富的预训练知识,克服多变量时间序列中的数据稀缺问题。具体而言,我们提出了LLMFew,这是一个LLM增强框架,用于研究LLMs在少量样本多变量时间序列分类方面的可行性和能力。该模型引入了一种斑块级时间卷积编码器(PTCEnc),将时间序列数据与LLMs的文本嵌入输入对齐。我们进一步使用低秩适应(LoRA)微调预训练的LLM解码器,以增强其在时间序列数据中的特征表示学习能力。实验结果表明,我们的模型在Handwriting和EthanolConcentration数据集中分别在分类准确性方面比最先进的基线方法高出125.2%和50.2%。此外,我们的实验结果表明,基于LLM的方法在少量样本多变量时间序列分类(few-shot MTSC)的各种数据集中表现出色,提供的结果比传统模型更可靠。这一成功为在数据有限的工业环境中部署这些方法铺平了道路。