LLM2D

摘要

这项工作旨在参与关于先前声称基于Transformer模型架构的预训练大型语言模型(LLM)具有感知能力的讨论。此类说法曾针对LaMDA模型提出，也针对当前一波由LLM驱动的聊天机器人(如ChatGPT)提出。如果这一说法得到证实，由于类似模型的广泛应用，将在自然语言处理(NLP)领域产生严重影响。然而，我们在此认为，这种大型语言模型不可能具有感知能力或意识，特别是LaMDA并没有表现出优于其他类似模型的任何特征使其具备感知能力。我们通过整合信息论(Integrated Information Theory)对意识的分析来论证这一点。我们将感知能力的主张视为在NLP报告中更广泛使用拟人化语言的一种趋势。无论这些说法是否属实，我们都认为这是一个审视语言建模进展并考虑其伦理影响的恰当时机。为了使这项工作对NLP领域以外的读者有所帮助，我们还介绍了语言建模的必要背景知识。