摘要
arXiv:2305.00948v3 宣告类型: replace-cross
摘要:大型语言模型(LLMs)的性能最近已经提升到可以很好地完成许多语言任务的程度。我们在这里表明,这是首次,这些模型也可以生成有效的元语言分析。我们概述了一项研究计划,其中通过提示测试这些任务上 LLMs 的行为可解释性。由于这些模型主要是在文本上进行训练的——因此,评估它们的元语言能力提高了我们对其一般能力的理解,并为语言学中的理论模型提供了新的见解。我们展示了 OpenAI 的 o1 在涉及绘制句法树和音系概括的任务中远远超出其他模型的表现。我们推测,OpenAI o1 相对于其他模型的独特优势可能源于该模型的链式思维机制,该机制模仿了在复杂认知任务(如语言分析)中人类推理的结构。