摘要
大型语言模型(LLM)在许多自然语言处理任务中取代了传统方法。然而,在命名实体识别(NER)中,现有的基于 LLM 的方法通常会产生看似合理但缺乏一致性和可靠性的输出,尤其是在模棱两可或复杂的情况下。确保输出与事实正确性和人类意图相一致是一个挑战。在现有方法中,为了提高一致性而牺牲准确性,这成为了一个问题。为了缓解这些挑战,我们提出了一种新颖的博弈论方法,用于在 LLM 输出生成解码阶段增强一致性和可靠性。我们的方法将解码过程建模为一个多阶段贝叶斯解码博弈。这通过正确性对齐来确保一致性,并通过歧义校准来增强可靠性。该模型动态地收敛到关于最可靠输出的共识,并区分 {有效,虚假} 输出,无需人工反馈或额外训练。我们的博弈设计允许较小的模型通过博弈机制(例如,78.1 LLaMA13B 对比 76.6 PaLM540B)优于更大的模型,以及整合各种 LL 策略和模型,证明了博弈论工具在提高 LLM 的真实性和可靠性方面的潜力。