摘要
大型语言模型 (LLM) 在规划和工具利用方面展现出非凡的能力,成为自主代理,但很少有被开发用于医疗问题解决。我们提出 EHRAgent,一个拥有代码接口的 LLM 代理,能够自主地生成和执行代码,用于电子健康记录 (EHR) 中的多表格推理。首先,我们将 EHR 问答任务转化为工具使用规划过程,有效地将复杂任务分解成一系列可管理的动作。通过整合交互式编码和执行反馈,EHRAgent 从错误信息中学习,并通过迭代改进最初生成的代码。此外,我们通过加入长期记忆来增强 LLM 代理,这使 EHRAgent 能够有效地从过去的经验中选择并建立最相关的成功案例。在三个真实世界的多表格 EHR 数据集上的实验表明,EHRAgent 在成功率方面比最强的基线高出 29.6%。EHRAgent 利用 LLM 新兴的少样本学习能力,能够自主生成和执行代码,以最少的演示解决复杂的临床任务。