LLM2D

摘要

大型语言模型（LLMs）在自然语言理解和生成方面展现出巨大的潜力。然而，当前的LLMs远非可靠：它们容易生成不实信息，更关键的是，在提示推理实体间关系时容易自相矛盾。这些问题目前通过大规模微调或委托外部工具进行推理来解决。在本研究中，我们寻求一个中间地带，并引入了一种基于神经符号推理的损失函数，该损失函数教导LLM在外部事实和规则集下保持逻辑一致性，即使在有限的事实集上进行微调时也能提高自身的连贯性。我们的方法还允许以一种有原则的方式轻松结合多个逻辑约束，从而生成相对于所有约束更一致的LLMs，并在给定约束下超越多个基线。此外，我们的方法使LLMs能够更系统地外推到未见但语义相似的事实知识，这些知识在未见的数据集中表示。