LLM2D
大型语言模型学习动态系统的控制原理,揭示了上下文神经网络的缩放规律
LLMs learn governing principles of dynamical systems, revealing an in-context neural scaling law
作者: Toni J. B. Liu, Nicolas Boull\'e, Rapha\"el Sarfati, Christopher J. Earls
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2402.00795v4

摘要

预训练大型语言模型 (LLM) 在执行零样本任务(包括时间序列预测)方面 surprisingly effective。然而,由于模型的复杂性,理解这些能力背后的机制仍然极具挑战性。我们研究了 LLM 推断动力系统行为的能力,这些动力系统的演化遵循具有物理意义的原理。我们的结果表明,主要基于文本训练的语言模型 LLaMA 2,无需微调或提示工程即可对动力系统时间序列进行准确预测。此外,学习到的物理规则的准确性随着输入上下文窗口长度的增加而提高,揭示了神经网络缩放定律的上下文版本。在此过程中,我们提出了一种灵活高效的算法,用于直接从 LLM 中提取多位数的概率密度函数。