摘要
人工智能(AI)已成为现代医疗保健不可或缺的一部分,大型语言模型(LLM)为临床决策带来了令人鼓舞的进步。传统的基于模型的方法,包括利用上下文演示和专门的医学微调方法,在医学语言处理方面已展现出强大的性能,但它们在实时适应性、多步骤推理和处理复杂医疗任务方面存在困难。基于Agent的AI系统通过整合推理轨迹、基于上下文的工具选择、知识检索以及短期和长期记忆来解决这些局限性。这些附加功能使医疗AI Agent能够处理复杂的医疗场景,其中决策应建立在与环境的实时交互之上。因此,与将医疗查询视为孤立问题的传统基于模型的方法不同,医疗AI Agent将它们视为复杂的任务,其行为更像人类医生。本文研究了医疗AI Agent中骨干LLM的选择,这是Agent整体推理和动作生成的基石。特别是,我们考虑了新兴的o1模型,并研究了其对Agent的推理、工具使用适应性和跨不同临床场景(包括重症监护室(ICU)等高风险环境)的实时信息检索的影响。我们的研究结果表明,o1能够提高诊断准确性和一致性,为更智能、更灵敏的AI工具铺平了道路,从而支持更好的患者预后和临床实践中的决策效率。