LLM2D
实践操作:分割连续序列中的 individual signs
Hands-On: Segmenting Individual Signs from Continuous Sequences
作者: Low Jian He, Harry Walsh, Ozge Mercanoglu Sincan, Richard Bowden
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.08593v2

摘要

arXiv:2504.08593v2 宣布类型: replace-cross 摘要:本文解决了连续手语分割的挑战,这是一个在手语翻译和数据标注方面具有巨大影响的关键任务。我们提出了一种基于变换器的架构,使用 Begin-In-Out (BIO) 标记方案将手语的时间动态和帧分割问题建模为序列标签问题。我们的方法利用了 HaMeR 手部特征,并结合了3D角度。广泛的实验表明,我们的模型在DGS语料库上达到了最先进的结果,而我们的特征在BSL语料库上超过了先前的基准。