摘要
arXiv:2411.15737v3 宣告类型: 替换
摘要: 大规模语言模型(LLMs)已经在多元时间序列分类(MTSC)中展示了其有效性。将LLMs有效地应用于MTSC需要信息丰富的数据表示。现有基于LLM的方法直接从头开始在LLM的潜空间中编码时间序列的嵌入,以与LLM的语义空间对齐。尽管这些方法有效,但我们发现它们隐藏了三个内在瓶颈:(1)它们难以以无损的方式编码时间特性和通道特异性信息,这两种信息都是多元时间序列的关键组成部分;(2)学习到的表示空间与LLM的语义空间对齐难度很大;(3)它们需要特定任务的重新训练,这既耗资又耗时。为了解决这些差距,我们提出了TableTime,它将MTSC重新定义为表格理解任务。具体来说,TableTime 引入了以下策略:(1)将多元时间序列转换为表格形式,从而最大限度地减少信息丢失;(2)以文本格式表示表格时间序列,以实现与LLM的语义空间的自然对齐;(3)设计一个推理框架,将上下文文本信息、邻域辅助、多路径推理和问题分解相结合,增强LLM的推理能力并实现零样本分类。在UEA存档中的10个公开代表性数据集上进行的广泛实验验证了TableTime的优势。