LLM2D

摘要

大型语言模型 (LLM) 在规划和工具利用方面展现出非凡的能力，成为自主代理，但很少有被开发用于医疗问题解决。我们提出 EHRAgent，一个拥有代码接口的 LLM 代理，能够自主地生成和执行代码，用于电子健康记录 (EHR) 中的多表格推理。首先，我们将 EHR 问答任务转化为工具使用规划过程，有效地将复杂任务分解成一系列可管理的动作。通过整合交互式编码和执行反馈，EHRAgent 从错误信息中学习，并通过迭代改进最初生成的代码。此外，我们通过加入长期记忆来增强 LLM 代理，这使 EHRAgent 能够有效地从过去的经验中选择并建立最相关的成功案例。在三个真实世界的多表格 EHR 数据集上的实验表明，EHRAgent 在成功率方面比最强的基线高出 29.6%。EHRAgent 利用 LLM 新兴的少样本学习能力，能够自主生成和执行代码，以最少的演示解决复杂的临床任务。