LLM2D

摘要

近年来，人工智能的进步催生了功能强大的大型语言模型 (LLM)，它们可以像人类一样执行任务。然而，LLM 在某些领域只表现出婴儿级别的认知能力。其中一个领域是 A-Not-B 错误，这是一种在婴儿中观察到的现象，即他们在观察到条件发生明显变化后，仍然重复之前被奖励的行为。这突出了它们缺乏抑制控制能力——即抑制习惯性或冲动性反应的能力。在我们的研究中，我们设计了一个类似于 A-Not-B 实验设置的基于文本的多项选择问答场景，以系统地测试 LLM 的抑制控制能力。我们发现，最先进的 LLM（如 Llama3-8b）在上下文学习 (ICL) 中表现始终出色，但在推理任务中会犯错误，当上下文发生微不足道的变化时，其推理能力下降高达 83.3%。这表明，在这一点上，LLM 的抑制控制能力仅与人类婴儿相当，在 ICL 期间，它们往往无法抑制先前建立的反应模式。