LLM2D

摘要

人脸表情识别在社交机器人、医疗保健、驾驶员疲劳监测以及许多其他实际场景中具有广阔的应用前景。计算机视觉研究界对人脸表情的自动识别进行了广泛的研究。但现实世界中的人脸表情识别仍然是一项具有挑战性的任务，部分原因在于数据集的长尾分布。许多最近的研究都使用数据增强来处理长尾识别任务。在本文中，我们提出了一种新颖的语义增强方法。通过在VAE-GAN的潜在空间中引入源数据的编码随机性，生成新的样本。然后，针对RAF-DB数据集中的面部表情识别，我们使用我们的增强方法来平衡长尾分布。我们的方法不仅可以用于FER任务，还可以用于更多数据匮乏的场景。