LLM2D

摘要

arXiv:2504.18631v1 宣布类型: 新摘要: 随着根据高维度异质时间序列信息及时制定个性化干预计划成为当前医疗领域的一项重要挑战，电子医疗记录、可穿戴设备以及其他多源医疗数据正在不断增加并多样化。在本文中，我们开发了一个基于组相对策略优化（GRPO）和时间序列数据融合生成个性化医疗干预策略的系统。首先，在策略梯度更新过程中引入组间的相对策略约束，我们能够自适应地平衡个体和群体的利益。为了提高决策的鲁棒性和可解释性，我们采用多层神经网络结构对患者特征进行组编码。其次，为了实现多模态的快速多源异质时间序列融合，我们使用结合自注意力机制的多通道神经网络进行动态特征提取。通过差分门控网络实现关键特征的选择和聚合。最后，提出了一种结合遗传算法和蒙特卡洛树搜索的协作搜索过程来寻找理想的干预策略，实现了全局优化。实验结果表明，与现有方法相比，该方法在准确性、覆盖率和决策效益方面取得了显著改进。