LLM2D

摘要

arXiv:2503.20428v1 声明类型：交叉摘要：本研究探讨了广泛使用的面部表情识别（FER）数据集在训练深度学习模型时的关键特性和适用性。在情感计算领域，面部表情识别对于解读人类情感至关重要，但FER系统的性能高度依赖于底层数据集的质量和多样性。为了解决这一问题，我们汇总并分析了24个FER数据集，包括针对特定年龄段的人群，如儿童、成人和老年人的数据集，并通过全面的标准化流程进行了处理。此外，我们还为这些数据集增加了自动标注的年龄和性别信息，从而使对其人口统计特性的评估更加细致。为进一步评估数据集的有效性，我们引入了三个新的度量标准：局部相似性、全局相似性和配对相似性，这些标准定量地衡量了数据集的难度、泛化能力和跨数据集的迁移性。使用最先进的神经网络进行基准实验表明，大规模、自动收集的数据集（例如AffectNet、FER2013）在泛化能力上表现较好，尽管存在标签噪声和人口统计偏差的问题，而受控数据集则提供了更高的标注质量，但变量较少。我们的研究结果为数据集的选择和设计提供了可操作的建议，推动了更稳健、公平和有效的FER系统的开发。