LLM2D

摘要

arXiv:2504.19188v1 类别：交叉学科摘要：大型语言模型（LLMs）在形式定理证明方面显示出潜力，但它们的标记级处理往往未能捕捉到数学证明的固有层次结构。我们引入了**层次注意力**作为一种正则化方法，使LLMs的注意力机制与数学推理结构对齐。我们的方法建立了从基本元素到高级概念的五级层次结构，确保了证明生成中的结构化信息流。实验表明，我们的方法在miniF2F上将证明成功率提高了2.05%，在ProofNet上提高了1.69%，同时分别减少了23.81%和16.50%的证明复杂性。相关代码可从https://github.com/Car-pe/HAGBP获取。