LLM2D
基于复数卷积神经网络的手势雷达图像分类
Complex-valued convolutional neural network classification of hand gesture from radar images
作者: Shokooh Khandan
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2410.02771v1

摘要

近年来,手势识别系统取得了许多令人振奋的进展,并在人机交互 (HCI) 中变得越来越流行,其应用领域涵盖从安全和安保到汽车领域。各种深度神经网络架构已被用于手势识别系统,包括多层感知器 (MLP)、卷积神经网络 (CNN)、循环神经网络 (RNN) 以及后两种架构的级联,称为 CNN-RNN。然而,仍然存在一个主要问题,即大多数现有的机器学习算法都是为实值 (RV) 设计和开发的构建块和技术。研究人员将各种 RV 技术应用于复值 (CV) 雷达图像,例如通过将复数分成实部和虚部,将 CV 优化问题转化为 RV 问题。然而,这种方法的主要缺点是,由此产生的算法会使网络维度加倍。最近关于 RNN 和其他基本理论分析的研究表明,CV 数字具有更丰富的表示能力,但由于缺乏设计此类模型所需的构建块,CV 网络的性能被边缘化。在本报告中,我们提出了一种全 CV-CNN,包括所有构建块、正向和反向操作以及复数域中的导数。我们探索了我们提出的分类模型在两组 CV 手势雷达图像上的表现,并将其与等效的 RV 模型进行了比较。在第五章中,我们提出了一种 CV 正向残差网络,用于对两组 CV 手势雷达数据集进行二元分类,并将其性能与我们提出的 CV-CNN 和基线 CV 正向 CNN 进行了比较。