LLM2D
卷积柯尔莫哥洛夫-阿诺尔德网络
Convolutional Kolmogorov-Arnold Networks
作者: Alexander Dylan Bodner, Antonio Santiago Tepsich, Jack Natan Spolski, Santiago Pourteau
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2406.13155v3

摘要

arXiv:2406.13155v3 宣告类型: replace-cross 摘要: 在本文中,我们提出了卷积柯尔莫哥罗夫-阿诺尔德网络(Covolutional Kolmogorov-Arnold Networks, ConvKANs),这是一种新颖的架构,将柯尔莫哥罗夫-阿诺尔德网络(Kolmogorov-Arnold Networks, KANs)的可学习样条激活函数整合到卷积层中。通过将传统的固定权重核替换为可学习的非线性函数,卷积KANs在参数效率和表达能力方面比标准卷积神经网络(Convolu-tional Neural Networks, CNNs)有了显著的改进。我们在Fashion-MNIST数据集上对卷积KANs进行了实证评估,证明其与基准经典卷积相比,参数量最多可减少50%的同时具有竞争力的精度。这表明KAN卷积能够有效地捕捉复杂的空间关系,使用更少的资源,为参数高效深度学习模型提供了一种有前景的替代方案。