LLM2D

摘要

大型语言模型 (LLM) 在时间序列方面的成功已在先前的工作中得到证明。利用符号时间序列表示，可以有效地弥合 LLM 和时间序列之间的差距。然而，剩余的挑战是如何利用时间序列中隐藏的语义信息（使用符号或LLM的现有标记），同时根据时间序列的隐藏信息调整LLM的嵌入空间。名为基于自适应布朗桥的符号聚合 (ABBA) 的符号时间序列逼近 (STSA) 方法，通过根据幅度和周期对时间序列模式建模，同时使用LLM的现有标记，在保留显著的时间序列特征方面显示出显著的功效。本文介绍了一种名为LLM-ABBA的方法，该方法将ABBA集成到大型语言模型中，用于各种下游时间序列任务。通过对时间序列进行符号化，LLM-ABBA 在 UCR 和三个医学时间序列分类任务中与最新的最先进技术 (SOTA) 相比具有优势。同时，ABBA 中引入了一种固定多边形链技巧，通过显著减轻从符号到数值转换过程中由于符号误用而产生的累积误差的影响，从而在预测任务中避免明显的漂移。在时间序列回归任务中，LLM-ABBA 在时间序列外回归 (TSER) 基准测试中取得了新的 SOTA 成绩。LLM-ABBA 还显示出与最新的 SOTA 时间序列预测结果相比具有竞争力的预测能力。我们相信这个框架也可以无缝地扩展到其他时间序列任务。