摘要
生成式大型语言模型(LLM)能够生成文本,但其文本内容与真实性之间缺乏直接对应关系,这被广泛认为类似于弗兰克福特在其著名专著《胡说八道》中描述的语言使用方式。本文对此进行了严格的探讨,确定了这种现象的成因及其分析方法。本文进一步论证了基于LLM的聊天机器人参与了“胡说八道的语言游戏”。我们利用统计文本分析方法,基于一个对比了1000篇科学出版物与ChatGPT生成的典型伪科学文本的数据集,对这种维特根斯坦式的语言游戏特征进行了研究。然后,我们探讨了在两种著名的社会功能障碍背景下是否可以检测到相同的语言特征:乔治·奥威尔对政治和语言的批判,以及大卫·格雷伯对“垃圾工作”的描述。利用简单的假设检验方法,我们证明了胡说八道语言的统计模型能够可靠地将ChatGPT生成的弗兰克福特式人工胡说八道与在自然人类语言中观察到的政治和工作场所中的胡说八道功能联系起来。