LLM2D
解锁预期文本生成:一种针对大型语言模型解码的约束方法
Unlocking Anticipatory Text Generation: A Constrained Approach for Large Language Models Decoding
作者: Lifu Tu, Semih Yavuz, Jin Qu, Jiacheng Xu, Rui Meng, Caiming Xiong, Yingbo Zhou
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2312.06149v4

摘要

大型语言模型 (LLM) 在文本生成方面展现出强大的能力。然而,在给定提示或指令的情况下获得最佳结果可能具有挑战性,特别是对于数十亿规模的模型。此外,还可能出现诸如毒性或幻觉等不良行为。虽然更大的模型(例如,ChatGPT)可能在缓解这些问题方面表现出优势,但仍不能完全保证预防。在这项工作中,我们建议将文本生成形式化为一个受未来约束的生成问题,以最大程度地减少不良行为并强制执行对指令的忠实度。使用 LLM 完成的未来约束满足估计引导文本生成过程。我们广泛的实验证明了所提方法在三种不同的文本生成任务中的有效性:关键字约束生成 (Lin 等人,2020)、毒性减少 (Gehman 等人,2020) 以及问答中的事实正确性 (Gao 等人,2023)。