LLM2D
HaSPeR: 一种用于手影傀儡识别的图像数据库
HaSPeR: An Image Repository for Hand Shadow Puppet Recognition
作者: Syed Rifat Raiyan, Zibran Zarif Amio, Sabbir Ahmed
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2408.10360v4

摘要

arXiv:2408.10360v4 宣告类型: replace-cross 摘要:手影戏,也被称为剪影艺术或ombre术,是一种通过在平面上投射手影来创造出活生生生物的幻象的戏剧艺术和讲故事方式。熟练的表演者通过手的位置、手指的动作和灵巧的手势来制造这些剪影,使其类似于动物和物体的影子。由于缺乏表演者以及人们娱乐标准的巨大变化,这种艺术形式正濒临灭绝。为了促进其保护并将其普及给更广泛的观众,我们介绍了${\rm H{\small A}SP{\small E}R}$数据集,这是一个包含15,000张手影戏图像的数据集,这些图像来自15个类别,数据集来源于专业和业余的手影戏片段。我们对数据集进行了详细的统计分析,并使用了一系列预训练的图像分类模型来建立基线。我们的研究发现,跳跃连接的卷积模型在性能上明显优于基于注意力的转换器架构。我们还发现,适合移动应用和嵌入式设备的轻量级模型,如MobileNetV2,表现得相当不错。我们推测,这种低延迟架构在开发ombre术教学工具方面可能很有用,并创建了一个原型应用程序来探索这一推测。保持表现最佳的模型ResNet34处于聚光灯下,我们对其特征-空间、解释性和错误进行了全面分析,以深入了解其决策过程。据我们所知,这是第一次使用计算机视觉方法来保护这种濒临灭绝的艺术形式的研究成果和数据集,我们将代码和数据公开发布。