LLM2D

摘要

arXiv:2302.10434v2 通知类型: 替换-交叉摘要：近年来，收集了大量的与慢性疾病相关的电子健康记录（EHRs），以促进医学诊断。通过动态治疗策略（DTRs）可以有效地建模与慢性疾病相关的动态特性。虽然强化学习（RL）是创建DTRs的广泛应用方法，但在处理大量数据方面开发有效的RL算法的研究仍在继续。在本文中，我们提出了一种可扩展的基于核的分布式Q学习算法，用于生成DTRs。我们对所提出的方法进行了理论评估和数值分析。结果表明，与最先进的深度强化学习方法相比，我们的算法显著降低了计算复杂性，同时在生存时间或累积生存概率等各阶段累计奖励的泛化性能方面保持了相当的表现。