LLM2D
关于卷积神经网络中最大池化特征图的移不变性探究
On the Shift Invariance of Max Pooling Feature Maps in Convolutional Neural Networks
作者: Hubert Leterme, K\'evin Polisano, Val\'erie Perrier, Karteek Alahari
发布日期: 4/21/2025
arXiv ID: oai:arXiv.org:2209.11740v3

摘要

arXiv:2209.11740v3 宣告类型: replace-cross 摘要:本文专注于提高卷积神经网络(CNN)在图像分类中的数学可解释性。具体而言,我们解决了它们第一层中存在的不稳定性问题,当在像ImageNet这样的数据集上训练时,这种层倾向于学习与定向带通滤波器相似的参数。使用这种Gabor-like滤波器的下采样卷积容易产生混叠,导致对输入移动的敏感性。在此背景下,我们建立了最大池化操作近似于复模数的条件,复模数几乎对移动不敏感。然后,我们推导了下采样卷积后最大池化的操作的移不变性度量。特别地,我们强调了滤波器的频率和方向在实现稳定性方面发挥的关键作用。我们通过考虑基于双树复小波变换的确定性特征提取器来验证我们的理论,这是一个离散Gabor-like分解的特殊情形。