LLM2D

摘要

arXiv:2305.00948v3 宣告类型: replace-cross 摘要：大型语言模型（LLMs）的性能最近已经提升到可以很好地完成许多语言任务的程度。我们在这里表明，这是首次，这些模型也可以生成有效的元语言分析。我们概述了一项研究计划，其中通过提示测试这些任务上 LLMs 的行为可解释性。由于这些模型主要是在文本上进行训练的——因此，评估它们的元语言能力提高了我们对其一般能力的理解，并为语言学中的理论模型提供了新的见解。我们展示了 OpenAI 的 o1 在涉及绘制句法树和音系概括的任务中远远超出其他模型的表现。我们推测，OpenAI o1 相对于其他模型的独特优势可能源于该模型的链式思维机制，该机制模仿了在复杂认知任务（如语言分析）中人类推理的结构。