摘要
arXiv:2505.04016v1 通知类型: cross
摘要:结构化输出对于关键应用(如代理和信息提取)中的大型语言模型(LLMs)至关重要。尽管它们具备这些能力,LLMs 通常会生成与预定义模式不符的输出,严重阻碍了可靠应用的开发。我们提出了SLOT(结构化LLM输出变换器),这是一种模型无关的方法,可以将非结构化的LLM输出转换为精确的结构化格式。现有解决方案大多依赖于受约束的解码技术,或者与特定模型紧密耦合,而SLOT则采用微调过的小型语言模型作为后处理层,可以在各种LLM和模式规定之间实现灵活性。我们介绍了一个系统性的数据收集和合成管道,以及一个正式的评估方法,该方法量化了模式准确性和内容保真度。我们的结果显示,带有受约束解码的微调Mistral-7B模型在模式准确性和内容相似度方面分别达到了99.5%和94.0%,远超Claude-3.5-Sonnet(分别高出25和20个百分点)。值得注意的是,即使是精简的模型如Llama-3.2-1B,在配备了SLOT的情况下,也能达到甚至超越许多更大且是专有的模型的结构化输出能力,在资源受限的环境中实现了可靠的结构化生成。