摘要
arXiv:2505.06993v1 Announce Type: cross
摘要:本文提出了一种新的视角来分析深度神经网络(DNNs)的泛化能力,即直接拆解并分析编码在DNN中的可泛化和不可泛化交互的动力学过程。具体而言,这项工作建立在近期可解释AI领域的理论成就之上,该理论证明了DNN的详细推断逻辑可以严格重写为少量的AND-OR交互模式。基于这一理论,我们提出了一种有效的方法来量化每种交互的泛化能力,并在训练过程中发现交互泛化能力的明显三阶段动态。特别是在训练的早期阶段,通常会去除嘈杂的和不可泛化的交互,并学习简单的和可泛化的交互。而在第二和第三阶段,倾向于捕捉越来越复杂的难以泛化的交互。实验结果验证了非泛化交互的学习是训练损失和测试损失之间差距的直接原因。