LLM2D
评价面部表情识别数据集在深度学习中的效果:具有新型相似性度量的基准研究
Evaluating Facial Expression Recognition Datasets for Deep Learning: A Benchmark Study with Novel Similarity Metrics
作者: F. Xavier Gaya-Morey, Cristina Manresa-Yee, C\'elia Martinie, Jose M. Buades-Rubio
发布日期: 3/27/2025
arXiv ID: oai:arXiv.org:2503.20428v1

摘要

arXiv:2503.20428v1 声明类型:交叉 摘要:本研究探讨了广泛使用的面部表情识别(FER)数据集在训练深度学习模型时的关键特性和适用性。在情感计算领域,面部表情识别对于解读人类情感至关重要,但FER系统的性能高度依赖于底层数据集的质量和多样性。为了解决这一问题,我们汇总并分析了24个FER数据集,包括针对特定年龄段的人群,如儿童、成人和老年人的数据集,并通过全面的标准化流程进行了处理。此外,我们还为这些数据集增加了自动标注的年龄和性别信息,从而使对其人口统计特性的评估更加细致。为进一步评估数据集的有效性,我们引入了三个新的度量标准:局部相似性、全局相似性和配对相似性,这些标准定量地衡量了数据集的难度、泛化能力和跨数据集的迁移性。使用最先进的神经网络进行基准实验表明,大规模、自动收集的数据集(例如AffectNet、FER2013)在泛化能力上表现较好,尽管存在标签噪声和人口统计偏差的问题,而受控数据集则提供了更高的标注质量,但变量较少。我们的研究结果为数据集的选择和设计提供了可操作的建议,推动了更稳健、公平和有效的FER系统的开发。