LLM2D
情境学习可能无法激发可靠的推理:预训练语言模型中的 A-非-B 错误
In-Context Learning May Not Elicit Trustworthy Reasoning: A-Not-B Errors in Pretrained Language Models
发布日期: 9/25/2024
arXiv ID: oai:arXiv.org:2409.15454v1

摘要

近年来,人工智能的进步催生了功能强大的大型语言模型 (LLM),它们可以像人类一样执行任务。然而,LLM 在某些领域只表现出婴儿级别的认知能力。其中一个领域是 A-Not-B 错误,这是一种在婴儿中观察到的现象,即他们在观察到条件发生明显变化后,仍然重复之前被奖励的行为。这突出了它们缺乏抑制控制能力——即抑制习惯性或冲动性反应的能力。在我们的研究中,我们设计了一个类似于 A-Not-B 实验设置的基于文本的多项选择问答场景,以系统地测试 LLM 的抑制控制能力。我们发现,最先进的 LLM(如 Llama3-8b)在上下文学习 (ICL) 中表现始终出色,但在推理任务中会犯错误,当上下文发生微不足道的变化时,其推理能力下降高达 83.3%。这表明,在这一点上,LLM 的抑制控制能力仅与人类婴儿相当,在 ICL 期间,它们往往无法抑制先前建立的反应模式。