LLM2D

摘要

人工智能（AI）已成为现代医疗保健不可或缺的一部分，大型语言模型（LLM）为临床决策带来了令人鼓舞的进步。传统的基于模型的方法，包括利用上下文演示和专门的医学微调方法，在医学语言处理方面已展现出强大的性能，但它们在实时适应性、多步骤推理和处理复杂医疗任务方面存在困难。基于Agent的AI系统通过整合推理轨迹、基于上下文的工具选择、知识检索以及短期和长期记忆来解决这些局限性。这些附加功能使医疗AI Agent能够处理复杂的医疗场景，其中决策应建立在与环境的实时交互之上。因此，与将医疗查询视为孤立问题的传统基于模型的方法不同，医疗AI Agent将它们视为复杂的任务，其行为更像人类医生。本文研究了医疗AI Agent中骨干LLM的选择，这是Agent整体推理和动作生成的基石。特别是，我们考虑了新兴的o1模型，并研究了其对Agent的推理、工具使用适应性和跨不同临床场景（包括重症监护室（ICU）等高风险环境）的实时信息检索的影响。我们的研究结果表明，o1能够提高诊断准确性和一致性，为更智能、更灵敏的AI工具铺平了道路，从而支持更好的患者预后和临床实践中的决策效率。