LLM2D
HaSPeR: 一种手影木偶识别的图像库
HaSPeR: An Image Repository for Hand Shadow Puppet Recognition
作者: Syed Rifat Raiyan, Zibran Zarif Amio, Sabbir Ahmed
发布日期: 2/17/2025
arXiv ID: oai:arXiv.org:2408.10360v5

摘要

arXiv:2408.10360v5 宣布类型: replace-cross 摘要: 手影戏,也称为影画或纤影术,是一种通过在平面上投射手影来创造活生生的生物幻觉的戏剧艺术和叙述形式。技艺高超的表演者通过手部位置、手指动作和灵巧的手势来创造这些剪影,使其看起来像动物和物体的影子。由于缺乏表演者以及人们娱乐标准的变化,这种艺术形式正处于灭绝边缘。为促进其保存并将其传播给更广泛的受众,我们介绍了${\rm H{\small A}SP{\small E}R}$,一个包含15,000张手影戏图像的新数据集,这些图像来自专业和业余手影表演者视频中的15个类别。我们提供了数据集的详细统计分析,并使用多种预训练图像分类模型建立了基线。我们的研究发现,跳跃连接卷积模型在性能上明显优于基于注意力的变压器架构。我们还发现,适合移动应用和嵌入式设备的轻量级模型,如MobileNetV2,在性能上表现相当出色。我们认为,这样的低延迟架构在开发纤影术教学工具方面可能非常有用,并创建了一个原型应用程序以探索这一假设。在保持表现最好的模型ResNet34的核心地位的同时,我们进行了综合的特征空间、可解释性和错误分析,以深入了解其决策过程。据我们所知,这是第一次采用计算机视觉方法来保存这种濒临灭绝的艺术形式的研究工作。我们的代码和数据将会公开。