LLM2D

摘要

arXiv:2502.13834v1 通知类型: 新摘要: 大型语言模型（LLMs）可以通过在一个证明系统内生成证明步骤（即，策略）来正式证明数学定理。然而，可能的策略空间庞大而复杂，而可用于形式证明的训练数据有限，这为基于LLM的策略生成带来了重大挑战。为了解决这一问题，我们提出了一种神经符号策略生成器，将LLM学习到的数学直觉与符号方法编码的领域特定见解相结合。这种整合的关键方面在于识别哪些部分的数学推理最适合LLM，哪些最适合符号方法。尽管神经符号整合的基本理念适用于各种数学问题，但在本文中，我们专门关注奥林匹克不等式（图1）。我们分析了人类是如何解决这些问题的，并将这些技术提炼为两种类型的策略：（1）缩放，由符号方法处理；（2）重写，由LLM处理。此外，我们将符号工具与LLM结合使用，以修剪和排名证明目标，从而提高高效的证明搜索效率。我们在来自多个数学竞赛的161个具有挑战性的不等式上评估了我们的框架，实现了最先进的性能，并明显优于现有的基于LLM和符号的方法，而无需额外的训练数据。