摘要
arXiv:2502.00346v1 支持类型: cross
摘要:背景:由于复杂的射束相互作用,IMRT的实时治疗计划具有挑战性。AI已经提高了自动化水平,但现有的模型需要大量的高质量数据集,并且缺乏普遍适用性。深度强化学习(DRL)通过模仿人类的尝试与错误规划提供了有前途的替代方案。
目的:开发一种基于随机策略的DRL代理,该代理具有高效的训练、广泛的应用性和对抗性攻击下的鲁棒性,并使用快速梯度符号方法(FGSM)。
方法:使用Actor-Critic with Experience Replay(ACER)架构,该代理在逆向规划中调整治疗计划参数(TPPs)。训练基于前列腺癌IMRT病例,使用剂量体积直方图(DVHs)作为输入。该模型在单个患者案例上进行训练,在两个独立案例上进行验证,并在三个数据集中测试了300多个计划。使用ProKnow分数评估计划质量,并通过对抗性攻击测试其鲁棒性。
结果:尽管仅在单个案例上进行训练,但模型 généralization 好。在基于ACER的规划之前,平均计划分数为6.20±1.84;之后,93.09%的病例达到了完美的9分,平均分为8.93±0.27。该代理有效地优先调整最优的TPPs,并且在对抗性攻击下保持鲁棒性。
结论:基于ACER的DRL代理能够实现高效、高质量的前列腺癌IMRT治疗计划,展示了强大的泛化能力和鲁棒性。