LLM2D
人工智能生成情感与人工评估一致性水平:一种方法论建议
Level of agreement between emotions generated by Artificial Intelligence and human evaluation: a methodological proposal
作者: Miguel Carrasco, Cesar Gonzalez-Martin, Sonia Navajas-Torrente, Raul Dastres
发布日期: 10/14/2024
arXiv ID: oai:arXiv.org:2410.08332v1

摘要

图像能够传递情感,但情感体验高度主观。人工智能的进步使得根据情感描述生成图像成为可能。然而,生成图像与人类情感反应之间的一致性程度尚未得到评估。为了解决这个问题,使用 StyleGAN2-ADA 生成了 20 幅艺术风景画。为每幅图像创建了四种变体,分别唤起积极情绪(满足感、娱乐感)和消极情绪(恐惧、悲伤),共计 80 幅图片。使用这些材料设计了一份在线问卷,61 名观察者对生成的图像进行了分类。对收集到的数据进行了统计分析,以确定参与者之间、观察者反应之间以及 AI 生成的情绪之间的一致性水平。结果表明,总体上的一致性水平良好,负面情绪的结果更好。然而,该研究证实了情感评估中固有的主观性。