LLM2D

摘要

为大型语言模型（LLMs）提供丰富的上下文信息已被证明可以提高其在各种任务中的性能，但由此产生的更长提示会增加计算成本，并且可能超过LLMs的输入限制。最近，一些提示压缩方法被提出，通过使用语言模型生成更短的提示或开发计算模型来选择原始提示的重要部分，从而缩短提示的长度。生成式压缩方法会遇到幻觉等问题，而选择性压缩方法没有涉及语言规则，忽略了提示的全局结构。为此，我们提出了一种名为PartPrompt的新型选择性压缩方法。它首先根据语言规则为每个句子获取一个解析树，并计算解析树中每个节点的局部信息熵。然后，这些局部解析树根据句子、段落和部分的依赖关系等层次结构组织成一个全局树。之后，提出了根向传播和叶向传播来调整全局树上的节点值。最后，开发了一种递归算法，根据调整后的节点值来修剪全局树。实验表明，PartPrompt在各种数据集、指标、压缩率和用于推理的目标LLMs上都取得了最先进的性能。深入的消融研究证实了PartPrompt中设计的有效性，其他附加实验也证明了其在压缩提示的连贯性和极长提示场景中的优越性。