LLM2D

摘要

arXiv:2502.00059v1 类别: cross 摘要: 大型语言模型（LLMs）在时间序列分析中已被广泛运用。然而，在涉及多变量时间序列数据的少量样本分类（即由于工业应用中可用训练数据有限而成为一个关键的训练场景）方面的实用性仍待探索。我们旨在利用LLMs中丰富的预训练知识，克服多变量时间序列中的数据稀缺问题。具体而言，我们提出了LLMFew，这是一个LLM增强框架，用于研究LLMs在少量样本多变量时间序列分类方面的可行性和能力。该模型引入了一种斑块级时间卷积编码器（PTCEnc），将时间序列数据与LLMs的文本嵌入输入对齐。我们进一步使用低秩适应（LoRA）微调预训练的LLM解码器，以增强其在时间序列数据中的特征表示学习能力。实验结果表明，我们的模型在Handwriting和EthanolConcentration数据集中分别在分类准确性方面比最先进的基线方法高出125.2%和50.2%。此外，我们的实验结果表明，基于LLM的方法在少量样本多变量时间序列分类（few-shot MTSC）的各种数据集中表现出色，提供的结果比传统模型更可靠。这一成功为在数据有限的工业环境中部署这些方法铺平了道路。