摘要
arXiv:2503.18755v1 类别: cross
摘要:第一人称开放手术视频捕捉了准确建模手术程序和手术室中人类行为所需的重要而细致的细节。对手和手术工具的详细像素级理解对于解读外科医生的动作和意图至关重要。我们介绍了EgoSurgery-HTS,这是一个新的数据集,带有像素级注释和对手术工具、手以及手工具交互分割的基准测试套件。具体来说,我们提供了(1)14种不同手术工具的实例分割标签数据集,(2)手的实例分割标签数据集,以及(3)手工具分割标签数据集以标记手和它们操控的工具。使用EgoSurgery-HTS,我们对最先进的分割方法进行了广泛的评估,并证明了与现有数据集相比,在第一人称开放手术视频中对手和手工具分割的准确性有了显著提高。该数据集将在https://github.com/Fujiry0/EgoSurgery发布。