LLM2D
野生环境中的豁免学习:Transformer 在现实世界多跳推理中的数据增强
Grokking in the Wild: Data Augmentation for Real-World Multi-Hop Reasoning with Transformers
作者: Roman Abramov, Felix Steinbauer, Gjergji Kasneci
发布日期: 4/30/2025
arXiv ID: oai:arXiv.org:2504.20752v1

摘要

arXiv:2504.20752v1 类型: cross 摘要:Transformer 在众多自然语言处理任务中取得了巨大成功,但在多步事实推理方面依然表现出显著的不足,尤其是在现实世界知识稀少的情况下。最近关于“grokking”的进展表明,神经网络在检测到潜在逻辑模式之后,可以从记忆过渡到完全泛化——然而,这些研究主要使用的是小型合成任务。在本文中,我们首次将“grokking”扩展到现实世界的事实数据,并通过精心设计合成数据增强现有的知识图谱,以提高推断的事实与基础事实比率 $\phi_r$,使其超过实现“grokking”的阈值。令人惊讶的是,我们发现即使使用事实错误的合成数据,也能加强新兴的推理电路,而不是降低准确性,因为它迫使模型依赖于关系结构而非记忆。在多跳推理基准测试中,我们的方法在2WikiMultiHopQA 上达到了高达95-100% 的准确性,显著超过了强大的基线方法,并与当前最先进的结果相当或超过。我们进一步深入分析了如何增加 $\phi_r$ 促进 Transformer 内部泛化电路的形成。我们的发现表明,基于“grokking”的数据增强可以解锁隐式的多跳推理能力,为大型语言模型中更强大和可解释的事实推理开启了大门。