LLM2D
流式学习:神经网络参数上的流匹配
Flow to Learn: Flow Matching on Neural Network Parameters
作者: Daniel Saragih, Deyu Cao, Tejas Balaji, Ashwin Santhosh
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2503.19371v2

摘要

arXiv:2503.19371v2 通告类型: replace-cross 摘要:基础语言模型在推理过程中通过上下文数据学习新概念的能力令人瞩目。然而,对于图像而言,类似的工作相对滞后。为了解决这一挑战,我们引入了FLoWN,这是一种学习生成不同任务神经网络参数的流匹配模型。我们的方法在潜空间中建模流,同时根据上下文数据对过程进行条件化。实验验证了FLoWN在元学习模型中达到了各种期望。此外,在分布内任务上,它与基线相当或超过基线,在分布外的少样本任务上表现出色,并且具有精细调节机制以提高性能。