LLM2D

摘要

arXiv:2502.00346v1 支持类型: cross 摘要：背景：由于复杂的射束相互作用，IMRT的实时治疗计划具有挑战性。AI已经提高了自动化水平，但现有的模型需要大量的高质量数据集，并且缺乏普遍适用性。深度强化学习（DRL）通过模仿人类的尝试与错误规划提供了有前途的替代方案。目的：开发一种基于随机策略的DRL代理，该代理具有高效的训练、广泛的应用性和对抗性攻击下的鲁棒性，并使用快速梯度符号方法（FGSM）。方法：使用Actor-Critic with Experience Replay（ACER）架构，该代理在逆向规划中调整治疗计划参数（TPPs）。训练基于前列腺癌IMRT病例，使用剂量体积直方图（DVHs）作为输入。该模型在单个患者案例上进行训练，在两个独立案例上进行验证，并在三个数据集中测试了300多个计划。使用ProKnow分数评估计划质量，并通过对抗性攻击测试其鲁棒性。结果：尽管仅在单个案例上进行训练，但模型 généralization 好。在基于ACER的规划之前，平均计划分数为6.20±1.84；之后，93.09%的病例达到了完美的9分，平均分为8.93±0.27。该代理有效地优先调整最优的TPPs，并且在对抗性攻击下保持鲁棒性。结论：基于ACER的DRL代理能够实现高效、高质量的前列腺癌IMRT治疗计划，展示了强大的泛化能力和鲁棒性。