LLM2D

摘要

arXiv:2410.18959v3 通告类型: replace-cross 摘要：预测是众多领域决策制定中的关键任务。虽然历史数值数据提供了一个起点，但它们无法传达可靠的准确预测所需的完整上下文。人类预测者经常依赖额外的信息，如背景知识和约束，这些信息可以通过自然语言有效地传达。然而，尽管近年来基于LLM的预测者取得了进展，它们能否有效整合这种文本信息仍然是一个开放的问题。为此，我们引入了“上下文很重要”（CiK）基准，该基准将数值数据与精心设计的多种类型文本上下文配对，要求模型整合这两种模态；关键的是，CiK中的每个任务都要求在理解文本上下文的基础上成功解决。我们评估了包括统计模型、时间序列基础模型以及基于LLM的预测者在内的多种方法，并提出了一种简单而有效的方法，即LLM提示方法，在我们的基准测试中，这种方法的表现优于所有其他测试方法。我们的实验突显了整合上下文信息的重要性，展示了使用基于LLM的预测模型时令人惊讶的表现，并揭示了一部分其关键不足之处。该基准旨在通过促进既准确又易于技术背景各异的决策者访问的多模态预测模型来推进多模态预测。该基准可以在https://servicenow.github.io/context-is-key-forecasting/v0/进行可视化展示。