LLM2D

摘要

arXiv:2410.04047v3 任务类型: replace-cross 摘要：时间序列分析在实际应用中至关重要，但传统方法仅关注孤立任务，而最近的时间序列推理研究仅局限于简单的一步推理，并且受到自然语言回答的约束。在这项工作中，我们提出了一个实用的新任务：多步时间序列推理，它要求时间序列分析中的组合推理和计算精度。为了解决这一挑战，我们提出了一种简单而有效的程序辅助推断代理，它利用大型语言模型（LLMs）的推理能力将复杂任务分解为结构化的执行管道。通过整合上下文学习、自我纠正和程序辅助执行，我们提出的方法确保了准确和可解释的结果。为了衡量性能，我们引入了一个新的数据集和统一的评估框架，其中包含特定任务的成功标准。实验表明，我们的方法在基本时间序列概念理解以及多步时间序列推理任务中均优于独立的一般目的LLMs，强调了将推理与计算精度相结合的混合方法的重要性。