摘要
arXiv:2501.18657v1 通告类型: 新
摘要: 大型语言模型(LLMs)在代码生成和逻辑推理任务中面临显著的标记效率瓶颈,这一挑战直接关系到推理成本和模型可解释性。本文提出了一种基于符号压缩的形式化框架,结合组合逻辑、信息论最优编码和上下文感知推理技术,在保持语义完整性的同时实现标记效率的跨越式提高。我们在函数式编程范式内建立了一个数学框架,推导了符号密度与模型可解释性之间的定量关系,并提出了一种可微压缩因子度量方法来评估编码效率。此外,我们利用参数效率微调(PEFT)技术,以低成本应用GAEL语言。实验结果表明,该方法在代码生成任务中实现了78.3%的标记压缩率,并通过结构显式性提高了逻辑可追溯性62%。这项研究为LLMs高效推理提供了新的理论工具,并为模型可解释性研究开辟了一条符号路径。