LLM2D
基于经验重播自动治疗计划的演员评论家方法在前列腺癌调强放疗中的应用
Actor Critic with Experience Replay-based automatic treatment planning for prostate cancer intensity modulated radiotherapy
作者: Md Mainul Abrar, Parvat Sapkota, Damon Sprouts, Xun Jia, Yujie Chi
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2502.00346v1

摘要

arXiv:2502.00346v1 支持类型: cross 摘要:背景:由于复杂的射束相互作用,IMRT的实时治疗计划具有挑战性。AI已经提高了自动化水平,但现有的模型需要大量的高质量数据集,并且缺乏普遍适用性。深度强化学习(DRL)通过模仿人类的尝试与错误规划提供了有前途的替代方案。 目的:开发一种基于随机策略的DRL代理,该代理具有高效的训练、广泛的应用性和对抗性攻击下的鲁棒性,并使用快速梯度符号方法(FGSM)。 方法:使用Actor-Critic with Experience Replay(ACER)架构,该代理在逆向规划中调整治疗计划参数(TPPs)。训练基于前列腺癌IMRT病例,使用剂量体积直方图(DVHs)作为输入。该模型在单个患者案例上进行训练,在两个独立案例上进行验证,并在三个数据集中测试了300多个计划。使用ProKnow分数评估计划质量,并通过对抗性攻击测试其鲁棒性。 结果:尽管仅在单个案例上进行训练,但模型 généralization 好。在基于ACER的规划之前,平均计划分数为6.20±1.84;之后,93.09%的病例达到了完美的9分,平均分为8.93±0.27。该代理有效地优先调整最优的TPPs,并且在对抗性攻击下保持鲁棒性。 结论:基于ACER的DRL代理能够实现高效、高质量的前列腺癌IMRT治疗计划,展示了强大的泛化能力和鲁棒性。