LLM2D
外科医生 vs. 计算机视觉:手术阶段识别能力的比较分析
Surgeons vs. Computer Vision: A comparative analysis on surgical phase recognition capabilities
作者: Marco Mezzina, Pieter De Backer, Tom Vercauteren, Matthew Blaschko, Alexandre Mottrie, Tinne Tuytelaars
发布日期: 4/29/2025
arXiv ID: oai:arXiv.org:2504.18954v1

摘要

arXiv:2504.18954v1 类别:交叉领域 摘要:目的:自动手术阶段识别(SPR)使用人工智能(AI)将手术工作流程分割为其关键事件,作为高效视频审查、手术教育以及技能评估的基础构建块。之前的研究所关注的都是短且线性的手术过程,并没有探讨时间上下文是否影响专家更好地分类手术阶段的能力。这项研究填补了这些空白,专注于高度非线性的机器人辅助部分肾切除术(RAPN)。方法:不同熟练程度的泌尿科医生被分组,并被要求在单个帧和视频片段上使用自定义网络平台标记RAPN的手术阶段。参与者报告了他们在决策中的置信水平和使用的视觉地标。随后,基于Cholec80数据集训练和评估的无时间上下文和有时间上下文的AI架构被应用于这个RAPN数据集。结果:视频片段和特定视觉地标的存在在所有组中提高了阶段分类的准确性。外科医生在分类中表现出高水平的置信度,并且优于表现出色但难以区分阶段的初学者。在两项研究中,当集成时间上下文时,AI模型的表现与调查中的外科医生相当,都有所改进。结论:专家外科医生和计算机视觉在SPR任务中都是复杂的工作,当给予相同的上下文时,两者表现相当。当提供时间信息时,性能会有所提高。手术工具和器官是人类解释的关键地标,并有望塑造自动SPR的未来。