LLM2D

摘要

预训练的大型语言模型（LLMs）在执行零样本任务（包括时间序列预测）方面意外地有效。然而，由于模型的复杂性，理解这些能力背后的机制仍然极具挑战。我们研究了 LLMs 预测受物理学原理控制的动力系统演化的能力。我们的结果表明，主要在文本上训练的语言模型 LLaMA 2 在没有微调或提示工程的情况下，可以准确地预测动力系统时间序列。此外，学习到的物理规则的准确性随着输入上下文窗口长度的增加而提高，揭示了神经缩放定律的上下文版本。在此过程中，我们提出了一种灵活高效的算法，用于直接从 LLMs 中提取多位数字的概率密度函数。