LLM2D
大型语言模型学习动态系统的控制原理,揭示了上下文神经网络的缩放规律
LLMs learn governing principles of dynamical systems, revealing an in-context neural scaling law
作者: Toni J. B. Liu, Nicolas Boull\'e, Rapha\"el Sarfati, Christopher J. Earls
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2402.00795v3

摘要

预训练的大型语言模型(LLMs)在执行零样本任务(包括时间序列预测)方面意外地有效。然而,由于模型的复杂性,理解这些能力背后的机制仍然极具挑战。我们研究了 LLMs 预测受物理学原理控制的动力系统演化的能力。我们的结果表明,主要在文本上训练的语言模型 LLaMA 2 在没有微调或提示工程的情况下,可以准确地预测动力系统时间序列。此外,学习到的物理规则的准确性随着输入上下文窗口长度的增加而提高,揭示了神经缩放定律的上下文版本。在此过程中,我们提出了一种灵活高效的算法,用于直接从 LLMs 中提取多位数字的概率密度函数。