LLM2D
基于神经演化的人原型注意力演化
Neuroevolution of Self-Attention Over Proto-Objects
作者: Rafael C. Pinto, Anderson R. Tavares
发布日期: 5/2/2025
arXiv ID: oai:arXiv.org:2505.00186v1

摘要

arXiv:2505.00186v1 交叉型公告 摘要:原型对象——具有共同视觉属性的图像区域,为神经网络中传统的基于矩形图像块的注意力机制提供了一种有希望的替代方案。尽管以前的工作表明,可以在控制器网络的同时训练基于块的硬注意力模块,以在视觉强化学习任务中实现最先进的性能,但我们的方法利用图像分割来处理高层特征。通过在原型对象而非固定块上操作,我们显著降低了表征复杂性:每个图像分解为的原型对象少于常规块,并且每个原型对象可以被有效地表示为紧凑的特征向量。这使得可以处理含有更丰富语义信息的自注意力模块。我们的实验结果表明,基于原型对象的方法在参数量减少62%和训练时间减少2.6倍的情况下,达到了或超过了基于块的实现的最先进的性能。