摘要
arXiv:2504.14708v1 交叉公告类型
摘要:基于电生理肌电图(EMG)的手势识别将前臂肌肉活动转换为假肢、康复和人机交互的控制命令。本文提出了一种新颖的基于EMG的手势识别方法,并引入了XMANet,它通过浅层到深层CNN专家之间的跨层互注意实现低级局部和高级语义线索的统一。通过短时傅里叶变换(STFT)和小波变换(WT)得到的堆叠频谱图和尺度图,我们将XMANet与ResNet50、DenseNet-121、MobileNetV3和EfficientNetB0进行了对比基准测试。在Grabmyo数据集上进行的实验结果表明,使用STFT时,所提出的XMANet模型分别在基线ResNet50、EfficientNetB0、MobileNetV3和DenseNet121模型上取得了约1.72%、4.38%、5.10%和2.53%的性能改进。当使用WT方法时,在相同的基线模型上分别观察到约1.57%、1.88%、1.46%和2.05%的性能改进。同样,在FORS EMG数据集上,使用STFT的XMANet(ResNet50)模型相比于基线ResNet50模型,显示出约5.04%的性能改进。相比之下,XMANet(DenseNet121)和XMANet(MobileNetV3)模型分别实现了约4.11%和2.81%的性能增强。此外,当使用WT时,所提出的XMANet在基线ResNet50、DenseNet121、MobileNetV3和EfficientNetB0模型上分别取得了约4.26%、9.36%、5.72%和6.09%的性能改进。这些结果证明了XMANet在不同架构和信号处理技术下持续提升了性能,展示了细粒度特征在准确和稳健的EMG分类中的强大潜力。