LLM2D

低张量秩适应的柯尔莫哥洛夫-阿诺尔德网络

Low Tensor-Rank Adaptation of Kolmogorov--Arnold Networks

作者: Yihang Gao, Michael K. Ng, Vincent Y. F. Tan

发布日期: 2/11/2025

arXiv ID: oai:arXiv.org:2502.06153v1

摘要

arXiv:2502.06153v1 宣告类型: cross 摘要: 科尔莫戈罗夫-阿诺尔德网络(KANs)已经在各个领域展示了其作为多层感知器(MLPs)的替代方案的潜力，尤其是在科学相关任务方面。然而，KANs的迁移学习仍是一个相对未被探索的领域。在这篇论文中，受张量的塔克分解以及KAN参数更新中存在低张量秩结构证据的启发，我们开发了低张量秩适应(LoTRA)方法以微调KANs。我们基于塔克分解近似研究了LoTRA的表达能力。此外，我们提供了一种理论分析来选择每个LoTRA分量的学习率，以便实现高效训练。我们的分析还表明，使用所有组件相同的学习率会导致训练效率低下，强调了需要采用自适应学习率策略。除了理论洞察之外，我们还探讨了LoTRA在通过微调KANs高效求解各种偏微分方程(PDEs)方面的应用。此外，我们提出了Slim KANs，该模型结合了KAN参数张量的固有低张量秩属性，从而减小模型大小同时保持优越性能。实验结果验证了所提出的学习率选择策略的有效性，并证明了LoTRA在KANs的PDEs求解中的迁移学习效果。进一步的评估表明，Slim KANs在函数表示和图像分类任务中的表现进一步突显了LoTRA的表达能力及其通过低张量秩分解减少参数的潜力。

查看原文下载 PDF