LLM2D

kolmogorov-阿诺德网络的低张量秩适应

Low Tensor-Rank Adaptation of Kolmogorov--Arnold Networks

作者: Yihang Gao, Michael K. Ng, Vincent Y. F. Tan

发布日期: 2/17/2025

arXiv ID: oai:arXiv.org:2502.06153v2

摘要

arXiv:2502.06153v2 宣布类型: 替换交叉摘要：Kolmogorov--Arnold网络（KANs）在各种领域中已被证明是多层感知机（MLPs）的一种替代方案，尤其是在科学任务方面。然而，KANs的迁移学习仍然是一个相对未探索的领域。在本文中，受张量的Tucker分解以及KAN参数更新中低张量秩结构证据的启发，我们为微调KANs开发了低张量秩适应（LoTRA）。我们基于Tucker分解近似来研究LoTRA的表示能力。此外，我们提供了一种理论分析，以选择每个LoTRA组件的学习率，从而使训练更加高效。我们的分析还表明，使用所有组件相同的学习率会导致训练效率低下，突显了需要适应性学习率策略的必要性。除了理论见解之外，我们还探讨了LoTRA在通过微调KANs高效解决各种偏微分方程（PDEs）中的应用。此外，我们提出了Slim KANs，将KAN参数张量的固有低张量秩特性整合其中，以减少模型大小并保持卓越性能。实验结果验证了所提出的适应性学习率选择策略的有效性，并展示了LoTRA在KANs解决PDEs中的迁移学习中的有效性。进一步评估Slim KANs在函数表示和图像分类任务中的性能表明LoTRA的灵活性以及通过低张量秩分解减少参数数量的潜力。

查看原文下载 PDF