LLM2D
大型语言模型作为准晶体:生成文本中的连贯性无重复现象
Large Language Models as Quasi-crystals: Coherence Without Repetition in Generative Text
作者: Jose Manuel Guevara-Vela
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2504.11986v2

摘要

arXiv:2504.11986v2 宣告类型: 替换交叉 摘要:本文提出了一个关于大型语言模型(LLMs)和准晶体之间解义类比的观点。准晶体是一种在系统中表现出全局一致性但没有周期性重复的现象,这种现象是通过局部约束产生的。尽管LLMs通常是从预测准确性、事实性或一致性的角度来进行评估,但这种结构视角表明,它们最典型的特征之一是生成内部共振的语言模式。准晶体的历史迫使人们对物理系统中的结构有序重新定义,这个类比突显了一种生成语言的替代模式:在没有重复或象征意图的情况下基于约束的组织。我们不将LLMs视为不完美的代理或随机近似,而是建议将其理解为产生准结构输出的生成器。这种框架补充了现有的评估范式,突出了形式的一致性和模式作为模型行为可解释特征的重要性。尽管这种类比有一定的局限性,但它提供了一个概念工具,用于探索在意义是涌现的、部分的或无法获得的系统中,一致性是如何产生和被评估的。为支持这一观点,本文借鉴了科学哲学和语言哲学,包括基于模型的科学表征解释、结构现实主义以及意义的推断观点。此外,我们还提出了结构评估的概念:一种评估方式,旨在考察输出如何在生成文本的不同段落中传播约束、变化和秩序。本文旨在重新框架当前关于大型语言模型的讨论,并非通过拒绝现有方法,而是通过提供一种基于结构而不是语义的解释轴。