LLM2D

摘要

arXiv:2501.18657v1 通告类型: 新摘要: 大型语言模型（LLMs）在代码生成和逻辑推理任务中面临显著的标记效率瓶颈，这一挑战直接关系到推理成本和模型可解释性。本文提出了一种基于符号压缩的形式化框架，结合组合逻辑、信息论最优编码和上下文感知推理技术，在保持语义完整性的同时实现标记效率的跨越式提高。我们在函数式编程范式内建立了一个数学框架，推导了符号密度与模型可解释性之间的定量关系，并提出了一种可微压缩因子度量方法来评估编码效率。此外，我们利用参数效率微调（PEFT）技术，以低成本应用GAEL语言。实验结果表明，该方法在代码生成任务中实现了78.3%的标记压缩率，并通过结构显式性提高了逻辑可追溯性62%。这项研究为LLMs高效推理提供了新的理论工具，并为模型可解释性研究开辟了一条符号路径。