LLM2D
ChatTS:通过合成数据将LLMs与时间序列对齐以增强理解和推理
ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning
作者: Zhe Xie, Zeyan Li, Xiao He, Longlong Xu, Xidao Wen, Tieying Zhang, Jianjun Chen, Rui Shi, Dan Pei
发布日期: 4/17/2025
arXiv ID: oai:arXiv.org:2412.03104v3

摘要

arXiv:2412.03104v3 宣告类型:替换 摘要:理解时间序列数据在实际应用场景中至关重要。最近,大型语言模型(LLMs)越来越被应用于时间序列任务,利用它们强大的语言能力来增强各种应用。然而,对于时间序列理解和推理解析的多模态LLMs(MLLMs)的研究仍然有限,主要是由于缺乏能够将时间序列与文本信息对齐的高质量数据集。本文介绍了ChatTS,一种专门用于时间序列分析的新型MLLM。ChatTS 将时间序列视为一种模态,类似于视觉MLLM处理图像的方式,使其能够进行时间和序列的理解与推理解析。为了解决训练数据稀缺性问题,我们提出了一种基于属性的方法,用于生成带有详细属性描述的合成时间序列。此外,我们引入了Time Series Evol-Instruct,这是一种新颖的方法,用于生成多样化的时序问答,增强模型的推理解析能力。据我们所知,ChatTS 是第一个接受多变量时间序列作为输入,用于理解和推理的TS-MLLM,并且仅在合成数据集上进行了专门的微调。我们使用包含实际数据的基准数据集对该模型进行了评估,包括六个对齐任务和四个推理任务。我们的结果显示,ChatTS 显著优于现有的基于视觉的MLLM(如GPT-4o)和基于文本/代理的LLM,在对齐任务中实现了46.0%的改进,在推理任务中实现了25.8%的改进。我们已在https://github.com/NetManAIOps/ChatTS 开放了源代码、模型检查点和数据集。