LLM2D

摘要

大型语言模型（LLM）在许多自然语言处理任务中取代了传统方法。然而，在命名实体识别（NER）中，现有的基于 LLM 的方法通常会产生看似合理但缺乏一致性和可靠性的输出，尤其是在模棱两可或复杂的情况下。确保输出与事实正确性和人类意图相一致是一个挑战。在现有方法中，为了提高一致性而牺牲准确性，这成为了一个问题。为了缓解这些挑战，我们提出了一种新颖的博弈论方法，用于在 LLM 输出生成解码阶段增强一致性和可靠性。我们的方法将解码过程建模为一个多阶段贝叶斯解码博弈。这通过正确性对齐来确保一致性，并通过歧义校准来增强可靠性。该模型动态地收敛到关于最可靠输出的共识，并区分 {有效，虚假} 输出，无需人工反馈或额外训练。我们的博弈设计允许较小的模型通过博弈机制（例如，78.1 LLaMA13B 对比 76.6 PaLM540B）优于更大的模型，以及整合各种 LL 策略和模型，证明了博弈论工具在提高 LLM 的真实性和可靠性方面的潜力。