LLM2D
学习针对奇异值域中线性变换的高级自注意力机制
Learning Advanced Self-Attention for Linear Transformers in the Singular Value Domain
作者: Hyowon Wi, Jeongwhan Choi, Noseong Park
发布日期: 5/14/2025
arXiv ID: oai:arXiv.org:2505.08516v1

摘要

arXiv:2505.08516v1 表型类型: cross 摘要:变换器在不同领域中表现出色。变换器的关键组件是自注意力,它学习输入序列中任意两个标记之间的关系。最近的研究表明,自注意力可以被理解为图的归一化邻接矩阵。值得注意的是,从图信号处理(GSP)的角度来看,自注意力可以等效定义为一个简单的图滤波器,使用值向量作为信号进行GSP。然而,自注意力是一个仅以多项式矩阵的一次阶定义的图滤波器,充当低通滤波器,阻止有效地利用各种频率信息。因此,现有的自注意力机制是以相当简化的形式设计的。因此,我们提出了一种名为 \underline{\textbf{A}}ttentive \underline{\textbf{G}}raph \underline{\textbf{F}}ilter (AGF) 的新方法,从图信号处理的角度,解释自注意力为有向图中的单值域学习图滤波器,具有与输入长度 \(n\) 的线性复杂度,即 \(\mathcal{O}(nd^2)\)。在我们的实验中,我们展示了AGF在各种任务上(包括长距离竞技场基准测试和时间序列分类)实现了最先进性能。