LLM2D
ReCAP:用于机器人手术技能评估中伪标签生成的递归交叉注意力网络
ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment
作者: Julien Quarez, Matthew Elliot, Oscar Maccormac, Marc Modat, Sebastien Ourselin, Jonathan Shapey, Alejandro Granados
发布日期: 10/23/2024
arXiv ID: oai:arXiv.org:2407.05180v2

摘要

在外科技能评估中,客观结构化技术技能评估(OSATS 分数)和全球评级量表(GRS)是用于评估外科医生在培训期间表现的既定工具。这些指标与他们表现的反馈相结合,使外科医生能够提高并达到实践标准。最近关于开源数据集 JIGSAW 的研究集中在从运动学信号、视频数据或两者的组合回归 GRS 分数,该数据集包含 GRS 和 OSATS 标签。在本文中,我们认为,单独回归 GRS 分数(一个无量纲值)过于限制,并且整个手术试验中的变化没有明显的临床意义。为了解决这一差距,我们开发了一个循环变换器模型,该模型通过将模型的隐藏状态与从运动学信号得出的五个 OSATS 分数相关联,来输出外科医生在整个训练课程中的表现。这些分数被平均和聚合以产生 GRS 预测,从而能够评估模型相对于最先进 (SOTA) 的性能。我们报告了斯皮尔曼相关系数 (SCC),表明我们的模型在所有任务中都优于 SOTA 模型,除了在留一主体外 (LOSO) 方案下的缝合(SCC 0.68-0.89),同时在留一用户外 (LOUO) 方案下的缝合和跨任务中获得了可比较的性能(SCC 0.45-0.68),并在穿针方面超过了 SOTA(0.69)。我们认为,将最终的 OSATS 分数与外科医生手术过程中的短时间实例相关联,比单个 GRS 分数更有临床意义。这种方法还使我们能够将定量预测转化为定性反馈,这对于任何自动外科技能评估流程都是至关重要的。一位资深外科医生验证了我们模型的行为,并在 77%(p = 0.006)的时间内同意了半监督预测。