LLM2D

摘要

在外科技能评估中，客观结构化技术技能评估（OSATS 分数）和全球评级量表（GRS）是用于评估外科医生在培训期间表现的既定工具。这些指标与他们表现的反馈相结合，使外科医生能够提高并达到实践标准。最近关于开源数据集 JIGSAW 的研究集中在从运动学信号、视频数据或两者的组合回归 GRS 分数，该数据集包含 GRS 和 OSATS 标签。在本文中，我们认为，单独回归 GRS 分数（一个无量纲值）过于限制，并且整个手术试验中的变化没有明显的临床意义。为了解决这一差距，我们开发了一个循环变换器模型，该模型通过将模型的隐藏状态与从运动学信号得出的五个 OSATS 分数相关联，来输出外科医生在整个训练课程中的表现。这些分数被平均和聚合以产生 GRS 预测，从而能够评估模型相对于最先进 (SOTA) 的性能。我们报告了斯皮尔曼相关系数 (SCC)，表明我们的模型在所有任务中都优于 SOTA 模型，除了在留一主体外 (LOSO) 方案下的缝合（SCC 0.68-0.89），同时在留一用户外 (LOUO) 方案下的缝合和跨任务中获得了可比较的性能（SCC 0.45-0.68），并在穿针方面超过了 SOTA（0.69）。我们认为，将最终的 OSATS 分数与外科医生手术过程中的短时间实例相关联，比单个 GRS 分数更有临床意义。这种方法还使我们能够将定量预测转化为定性反馈，这对于任何自动外科技能评估流程都是至关重要的。一位资深外科医生验证了我们模型的行为，并在 77%（p = 0.006）的时间内同意了半监督预测。