LLM2D

摘要

arXiv:2412.03104v3 宣告类型：替换摘要：理解时间序列数据在实际应用场景中至关重要。最近，大型语言模型（LLMs）越来越被应用于时间序列任务，利用它们强大的语言能力来增强各种应用。然而，对于时间序列理解和推理解析的多模态LLMs（MLLMs）的研究仍然有限，主要是由于缺乏能够将时间序列与文本信息对齐的高质量数据集。本文介绍了ChatTS，一种专门用于时间序列分析的新型MLLM。ChatTS 将时间序列视为一种模态，类似于视觉MLLM处理图像的方式，使其能够进行时间和序列的理解与推理解析。为了解决训练数据稀缺性问题，我们提出了一种基于属性的方法，用于生成带有详细属性描述的合成时间序列。此外，我们引入了Time Series Evol-Instruct，这是一种新颖的方法，用于生成多样化的时序问答，增强模型的推理解析能力。据我们所知，ChatTS 是第一个接受多变量时间序列作为输入，用于理解和推理的TS-MLLM，并且仅在合成数据集上进行了专门的微调。我们使用包含实际数据的基准数据集对该模型进行了评估，包括六个对齐任务和四个推理任务。我们的结果显示，ChatTS 显著优于现有的基于视觉的MLLM（如GPT-4o）和基于文本/代理的LLM，在对齐任务中实现了46.0%的改进，在推理任务中实现了25.8%的改进。我们已在https://github.com/NetManAIOps/ChatTS 开放了源代码、模型检查点和数据集。