LLM2D

摘要

arXiv:2406.13155v3 宣告类型: replace-cross 摘要: 在本文中，我们提出了卷积柯尔莫哥罗夫-阿诺尔德网络(Covolutional Kolmogorov-Arnold Networks, ConvKANs)，这是一种新颖的架构，将柯尔莫哥罗夫-阿诺尔德网络(Kolmogorov-Arnold Networks, KANs)的可学习样条激活函数整合到卷积层中。通过将传统的固定权重核替换为可学习的非线性函数，卷积KANs在参数效率和表达能力方面比标准卷积神经网络(Convolu-tional Neural Networks, CNNs)有了显著的改进。我们在Fashion-MNIST数据集上对卷积KANs进行了实证评估，证明其与基准经典卷积相比，参数量最多可减少50%的同时具有竞争力的精度。这表明KAN卷积能够有效地捕捉复杂的空间关系，使用更少的资源，为参数高效深度学习模型提供了一种有前景的替代方案。