LLM2D
通过神经符号集成实现逻辑一致的语言模型
Logically Consistent Language Models via Neuro-Symbolic Integration
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.13724v1

摘要

大型语言模型(LLMs)在自然语言理解和生成方面展现出巨大的潜力。然而,当前的LLMs远非可靠:它们容易生成不实信息,更关键的是,在提示推理实体间关系时容易自相矛盾。这些问题目前通过大规模微调或委托外部工具进行推理来解决。在本研究中,我们寻求一个中间地带,并引入了一种基于神经符号推理的损失函数,该损失函数教导LLM在外部事实和规则集下保持逻辑一致性,即使在有限的事实集上进行微调时也能提高自身的连贯性。我们的方法还允许以一种有原则的方式轻松结合多个逻辑约束,从而生成相对于所有约束更一致的LLMs,并在给定约束下超越多个基线。此外,我们的方法使LLMs能够更系统地外推到未见但语义相似的事实知识,这些知识在未见的数据集中表示。