摘要
arXiv:2405.02079v2 宣告类型: replace-cross
摘要:大型语言模型(LLMs)中编码的知识丰富以及它们在各种环境中零样本应用这些知识的能力,使它们成为决策制定中使用的有前途的候选者。然而,它们目前受限于无法提供可忠实解释并有效质疑以纠正错误的输出。在这篇论文中,我们通过引入具有论证推理能力的大型语言模型(ArgLLMs),尝试调和这些优势和劣势。具体来说,ArgLLMs 构建论证框架,这些框架则作为支持决策制定的形式推理的基础。这些论证框架的可解释性以及形式推理意味着任何由 ArgLLMs 作出的决策都可以进行解释和质疑。我们在决策制定任务(即声明验证)的背景下,通过实验评估了 ArgLLMs 的性能,与最先进的技术进行了比较。我们还定义了新的属性来表征可质疑性,并从这些属性出发对 ArgLLMs 进行正式评估。