LLM2D
一个循环视觉变换器展示了灵长类视觉注意的特征
A recurrent vision transformer shows signatures of primate visual attention
作者: Jonathan Morgan, Badr Albanna, James P. Herman
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.10955v1

摘要

arXiv:2502.10955v1 类型: 交叉学科 摘要: 注意力在生物学和人工智能中都是基础性的,然而关于动物注意力和AI自注意力的研究仍然 largely disconnected。我们提出了一种递归视觉变换器(Recurrent Vision Transformer,Recurrent ViT),它将自注意力与递归记忆结合起来,使得当前输入和存储的信息都能指导注意力分配。仅通过在空间线索指示的方向改变检测任务中使用稀疏奖励反馈进行训练,我们的模型在被指示刺激上的准确性和响应速度方面表现出类似灵长类动物的特点,且这些性能随线索有效性增加而提高。自我注意力图的分析揭示了动态的空间优先级分配,在预期变化之前会重新激活,且有针对性的干扰产生了与灵长类前额眼区和上丘观察到的性能变化相似的结果。这些发现表明,在自注意力中整合递归反馈可以捕捉灵长类视觉注意力的关键方面。