LLM2D

摘要

arXiv:2504.13139v2 宣布类型: 替换-交叉摘要：许多语言模型（LM）应用需要生成符合句法或语义约束的文本。施加这些约束可以自然地被视为概率约束，但从由此产生的分布中进行精确生成——这与LM的基本分布可能大相径庭——通常是不可行的。在本文中，我们基于序贯蒙特卡洛（SMC）开发了一种受控LM生成架构。我们的SMC框架允许我们在推理时灵活地结合领域和特定问题的约束，并在生成过程中根据新信息高效地重新分配计算资源。通过对四个具有挑战性的领域——数据科学中的Python代码生成、文本到SQL、目标推断和分子合成——进行多种替代方案和消融研究，我们证明，在少量额外开销的情况下，我们的方法使小型开源语言模型能够在性能上超过8倍更大的模型，甚至比闭源的微调模型更好。为了支持概率视角，我们展示了这些性能提升是由对后验分布更好的近似所驱动的。我们的系统基于Lew等人（2023）的框架，并与其语言模型的概率编程语言集成，为用户提供了一种简单且可编程的方法来将SMC应用于广泛的受控生成问题中。