LLM2D

摘要

arXiv:2505.04016v1 通知类型: cross 摘要：结构化输出对于关键应用（如代理和信息提取）中的大型语言模型（LLMs）至关重要。尽管它们具备这些能力，LLMs 通常会生成与预定义模式不符的输出，严重阻碍了可靠应用的开发。我们提出了SLOT（结构化LLM输出变换器），这是一种模型无关的方法，可以将非结构化的LLM输出转换为精确的结构化格式。现有解决方案大多依赖于受约束的解码技术，或者与特定模型紧密耦合，而SLOT则采用微调过的小型语言模型作为后处理层，可以在各种LLM和模式规定之间实现灵活性。我们介绍了一个系统性的数据收集和合成管道，以及一个正式的评估方法，该方法量化了模式准确性和内容保真度。我们的结果显示，带有受约束解码的微调Mistral-7B模型在模式准确性和内容相似度方面分别达到了99.5%和94.0%，远超Claude-3.5-Sonnet（分别高出25和20个百分点）。值得注意的是，即使是精简的模型如Llama-3.2-1B，在配备了SLOT的情况下，也能达到甚至超越许多更大且是专有的模型的结构化输出能力，在资源受限的环境中实现了可靠的结构化生成。