摘要
arXiv:2502.04408v1 交叉公告类型
摘要:放射治疗是癌症治疗中至关重要的手段,需要精确规划以平衡肿瘤消除和健康组织的保护。传统的治疗规划(TP)是一个迭代、耗时的过程,并且依赖于人类的专业知识,这可能会引入变异性并导致低效性。我们提出了一种新的框架,通过少量样本强化学习(RL)方法将一个大型多模态基础模型(MLM)转变为治疗规划(TP)的动作模型。我们的方法利用MLM广泛存在的关于物理、辐射和解剖学的知识,并通过少量样本学习过程对其进行增强。这使得模型能够使用蒙特卡洛模拟器迭代地改进治疗计划。我们的结果显示,该方法在质量和效率上都优于传统的基于RL的方法,在前列腺癌数据的模拟中实现了更高的奖励得分和更理想的剂量分布。该概念验证表明,将高级AI模型整合到临床工作流中具有潜在的前景,可能提高放疗治疗规划的速度、质量和标准化程度。