LLM2D

摘要

arXiv:2410.18959v2 宣告类型: replace-cross 摘要：预测是众多领域决策制定中的关键任务。尽管历史数值数据提供了一个起点，但它们未能传达可靠和准确预测所需的完整背景信息。人类预测者通常依赖额外的信息，如背景知识和约束条件，这些信息可以通过自然语言高效地传达。然而，尽管最近在基于大语言模型（LLM）的预测者方面取得了进展，他们在这方面的有效性依然存在疑问。为了应对这一挑战，我们引入了“关键在于背景”（CiK）这一时间序列预测基准，该基准将数值数据与多种精心设计的文本背景相结合，要求模型整合这两种模式。关键的是，CiK 中的每个任务都要求理解文本背景才能成功解决。我们评估了一系列方法，包括统计模型、时间序列基础模型和基于大语言模型的预测者，提出了一种简单但有效的 LLM 提示方法，该方法在我们的基准上优于所有其他测试方法。我们的实验突显了 Incorporate Contextual Information 的重要性，展示了基于大语言模型的预测模型的惊人性能，同时也揭示了它们的一些关键缺陷。该基准旨在通过推动既准确又易于不同技术背景的决策者使用的模型，来促进多模态预测的发展。该基准可以在 https://anon-forecast.github.io/benchmark_report_dev/ 可视化。