摘要
arXiv:2502.01303v1 声明类型: cross
摘要: 设计一个能够在不牺牲精度和吞吐量的情况下使网络保持低参数和FLOPs的模块或机制仍然是一项挑战。为了解决这一挑战并利用特征图通道内的冗余,我们提出了一种新的解决方案:部分通道机制(PCM)。具体来说,通过拆分操作,特征图通道被分为不同的部分,每个部分对应不同的操作,如卷积、注意、池化和恒等映射。基于这一假设,我们引入了一种新颖的部分注意卷积(PATConv),它可以高效地将卷积与视觉注意力结合起来。我们的探索表明,PATConv可以完全替代标准卷积和标准视觉注意力,并减少模型参数和FLOPs。此外,PATConv可以导出三种新的类型模块:部分通道注意力模块(PAT_ch)、部分空间注意力模块(PAT_sp)和部分自注意力模块(PAT_sf)。此外,我们提出了一种新的可变部分卷积(DPConv),它能够根据不同层的拆分通道比例适应性地学习,以实现更好的权衡。基于PATConv和DPConv,我们提出了一种新的混合网络家族,名为PartialNet,该家族在ImageNet-1K分类任务上获得了优越的Top-1精度和推理速度,并在COCO数据集的检测和分割方面表现出色。我们的代码可在https://github.com/haiduo/PartialNet获取。