LLM2D
大型语言模型的顺序蒙特卡罗语法和语义控制
Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo
作者: Jo\~ao Loula, Benjamin LeBrun, Li Du, Ben Lipkin, Clemente Pasti, Gabriel Grand, Tianyu Liu, Yahya Emara, Marjorie Freedman, Jason Eisner, Ryan Cotterell, Vikash Mansinghka, Alexander K. Lew, Tim Vieira, Timothy J. O'Donnell
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2504.13139v2

摘要

arXiv:2504.13139v2 宣布类型: 替换-交叉 摘要:许多语言模型(LM)应用需要生成符合句法或语义约束的文本。施加这些约束可以自然地被视为概率约束,但从由此产生的分布中进行精确生成——这与LM的基本分布可能大相径庭——通常是不可行的。在本文中,我们基于序贯蒙特卡洛(SMC)开发了一种受控LM生成架构。我们的SMC框架允许我们在推理时灵活地结合领域和特定问题的约束,并在生成过程中根据新信息高效地重新分配计算资源。通过对四个具有挑战性的领域——数据科学中的Python代码生成、文本到SQL、目标推断和分子合成——进行多种替代方案和消融研究,我们证明,在少量额外开销的情况下,我们的方法使小型开源语言模型能够在性能上超过8倍更大的模型,甚至比闭源的微调模型更好。为了支持概率视角,我们展示了这些性能提升是由对后验分布更好的近似所驱动的。我们的系统基于Lew等人(2023)的框架,并与其语言模型的概率编程语言集成,为用户提供了一种简单且可编程的方法来将SMC应用于广泛的受控生成问题中。