LLM2D

摘要

arXiv:2504.04110v1 宣告类型: 新颖摘要: 在人工智能领域，有效整合物质推理和形式推理一直是一个持续的挑战——前者关注论据的合理性及其背景相关性，而后者则关注其逻辑和结构的有效性。由于大型语言模型（LLMs）在其广泛的大型文本语料库预训练的基础上展现出强大的物质推理能力，但其推理往往缺乏形式上的严谨性和可验证性。与此同时，LLMs 在语言学上的能力使其成为自然语言和形式语言之间的一个有前景的桥梁，为结合这两种推理方式带来了新机会。在这篇论文中，我们介绍了 PEIRCE，这是一种神经符号框架，旨在通过迭代的假设-批判过程统一物质和形式推理。在这个框架中，LLMs 在生成自然语言和形式语言中的候选解决方案方面扮演核心角色，这些解决方案随后通过与外部批判模型的交互进行评估和改进。这些批判性反馈包括形式证明器，它们评估形式有效性，以及软评估器，它们根据合理性、连贯性和简约性等语言和知识维度来衡量生成论据的质量。虽然 PEIRCE 是一个通用框架，但我们展示了它在自然语言解释生成领域的能力——这是一个本质上需要物质充分性和形式正确性的环境。