LLM2D

摘要

arXiv:2505.08516v1 表型类型: cross 摘要：变换器在不同领域中表现出色。变换器的关键组件是自注意力，它学习输入序列中任意两个标记之间的关系。最近的研究表明，自注意力可以被理解为图的归一化邻接矩阵。值得注意的是，从图信号处理（GSP）的角度来看，自注意力可以等效定义为一个简单的图滤波器，使用值向量作为信号进行GSP。然而，自注意力是一个仅以多项式矩阵的一次阶定义的图滤波器，充当低通滤波器，阻止有效地利用各种频率信息。因此，现有的自注意力机制是以相当简化的形式设计的。因此，我们提出了一种名为 \underline{\textbf{A}}ttentive \underline{\textbf{G}}raph \underline{\textbf{F}}ilter (AGF) 的新方法，从图信号处理的角度，解释自注意力为有向图中的单值域学习图滤波器，具有与输入长度 \(n\) 的线性复杂度，即 \(\mathcal{O}(nd^2)\)。在我们的实验中，我们展示了AGF在各种任务上（包括长距离竞技场基准测试和时间序列分类）实现了最先进性能。