LLM2D

摘要

近年来，手势识别系统取得了许多令人振奋的进展，并在人机交互 (HCI) 中变得越来越流行，其应用领域涵盖从安全和安保到汽车领域。各种深度神经网络架构已被用于手势识别系统，包括多层感知器 (MLP)、卷积神经网络 (CNN)、循环神经网络 (RNN) 以及后两种架构的级联，称为 CNN-RNN。然而，仍然存在一个主要问题，即大多数现有的机器学习算法都是为实值 (RV) 设计和开发的构建块和技术。研究人员将各种 RV 技术应用于复值 (CV) 雷达图像，例如通过将复数分成实部和虚部，将 CV 优化问题转化为 RV 问题。然而，这种方法的主要缺点是，由此产生的算法会使网络维度加倍。最近关于 RNN 和其他基本理论分析的研究表明，CV 数字具有更丰富的表示能力，但由于缺乏设计此类模型所需的构建块，CV 网络的性能被边缘化。在本报告中，我们提出了一种全 CV-CNN，包括所有构建块、正向和反向操作以及复数域中的导数。我们探索了我们提出的分类模型在两组 CV 手势雷达图像上的表现，并将其与等效的 RV 模型进行了比较。在第五章中，我们提出了一种 CV 正向残差网络，用于对两组 CV 手势雷达数据集进行二元分类，并将其性能与我们提出的 CV-CNN 和基线 CV 正向 CNN 进行了比较。