LLM2D
大型语言模型的输出结构化
SLOT: Structuring the Output of Large Language Models
作者: Darren Yow-Bang Wang, Zhengyuan Shen, Soumya Smruti Mishra, Zhichao Xu, Yifei Teng, Haibo Ding
发布日期: 5/8/2025
arXiv ID: oai:arXiv.org:2505.04016v1

摘要

arXiv:2505.04016v1 通知类型: cross 摘要:结构化输出对于关键应用(如代理和信息提取)中的大型语言模型(LLMs)至关重要。尽管它们具备这些能力,LLMs 通常会生成与预定义模式不符的输出,严重阻碍了可靠应用的开发。我们提出了SLOT(结构化LLM输出变换器),这是一种模型无关的方法,可以将非结构化的LLM输出转换为精确的结构化格式。现有解决方案大多依赖于受约束的解码技术,或者与特定模型紧密耦合,而SLOT则采用微调过的小型语言模型作为后处理层,可以在各种LLM和模式规定之间实现灵活性。我们介绍了一个系统性的数据收集和合成管道,以及一个正式的评估方法,该方法量化了模式准确性和内容保真度。我们的结果显示,带有受约束解码的微调Mistral-7B模型在模式准确性和内容相似度方面分别达到了99.5%和94.0%,远超Claude-3.5-Sonnet(分别高出25和20个百分点)。值得注意的是,即使是精简的模型如Llama-3.2-1B,在配备了SLOT的情况下,也能达到甚至超越许多更大且是专有的模型的结构化输出能力,在资源受限的环境中实现了可靠的结构化生成。