LLM2D
通过符号压缩提升大型语言模型效率:一种面向可解释性的正式方法
Enhancing Large Language Model Efficiencyvia Symbolic Compression: A Formal Approach Towards Interpretability
作者: Lumen AI, Tengzhou No. 1 Middle School, Shihao Ji, Zihui Song, Fucheng Zhong, Jisen Jia, Zhaobo Wu, Zheyi Cao, Tianhao Xu
发布日期: 2/3/2025
arXiv ID: oai:arXiv.org:2501.18657v1

摘要

arXiv:2501.18657v1 通告类型: 新 摘要: 大型语言模型(LLMs)在代码生成和逻辑推理任务中面临显著的标记效率瓶颈,这一挑战直接关系到推理成本和模型可解释性。本文提出了一种基于符号压缩的形式化框架,结合组合逻辑、信息论最优编码和上下文感知推理技术,在保持语义完整性的同时实现标记效率的跨越式提高。我们在函数式编程范式内建立了一个数学框架,推导了符号密度与模型可解释性之间的定量关系,并提出了一种可微压缩因子度量方法来评估编码效率。此外,我们利用参数效率微调(PEFT)技术,以低成本应用GAEL语言。实验结果表明,该方法在代码生成任务中实现了78.3%的标记压缩率,并通过结构显式性提高了逻辑可追溯性62%。这项研究为LLMs高效推理提供了新的理论工具,并为模型可解释性研究开辟了一条符号路径。