LLM2D

摘要

arXiv:2505.02417v2 宣布类型: 替换-交叉摘要: 文本到时间序列生成在解决数据稀疏性、不平衡性和跨领域时间序列多模态数据集有限可用性等挑战方面具有巨大的潜力。虽然扩散模型在文本到X（例如，视觉和音频数据）生成中取得了显著的成功，但它们在时间序列生成中的应用仍处于起步阶段。现有方法面临两个关键限制：（1）系统探索通用的时间序列描述词不足，这些描述词往往是领域特定的，并且难以泛化；以及（2）无法生成任意长度的时间序列，限制了其在实际应用场景中的应用。在本文中，我们首先将时间序列描述词分为三个级别：点级、片段级和实例级。此外，我们引入了一个新的片段级数据集，包含超过600,000个高分辨率的时间序列-文本对。其次，我们提出了一种基于扩散模型的框架Text-to-Series（T2S），以一种领域无关的方式弥合自然语言和时间序列之间的差距。T2S 使用长度自适应的变分自动编码器将不同长度的时间序列编码为一致的潜在嵌入。在此基础上，T2S 通过使用Flow Matching 和采用Diffusion Transformer 作为去噪器有效地对齐文本表示与潜在嵌入。我们以交错的方式训练 T2S，使其能够生成任何所需长度的序列。广泛的评估表明，T2S 在横跨12个领域13个数据集上都达到了最先进的性能。