LLM2D
层次注意生成更好的证明
Hierarchical Attention Generates Better Proofs
作者: Jianlong Chen, Chao Li, Yang Yuan, Andrew C Yao
发布日期: 4/29/2025
arXiv ID: oai:arXiv.org:2504.19188v1

摘要

arXiv:2504.19188v1 类别:交叉学科 摘要:大型语言模型(LLMs)在形式定理证明方面显示出潜力,但它们的标记级处理往往未能捕捉到数学证明的固有层次结构。我们引入了**层次注意力**作为一种正则化方法,使LLMs的注意力机制与数学推理结构对齐。我们的方法建立了从基本元素到高级概念的五级层次结构,确保了证明生成中的结构化信息流。实验表明,我们的方法在miniF2F上将证明成功率提高了2.05%,在ProofNet上提高了1.69%,同时分别减少了23.81%和16.50%的证明复杂性。相关代码可从https://github.com/Car-pe/HAGBP获取。