摘要
大型语言模型(LLMs)在各种自然语言处理任务中表现出了令人惊讶的性能。最近,结合了领域特定知识的医学大型语言模型在医疗咨询和诊断方面展现了卓越的能力。这些模型可以流畅地模拟医患对话,并提供专业的医疗建议。大多数医学大型语言模型是通过对开源通用大型语言模型的持续训练开发的,这比从头开始训练大型语言模型所需的计算资源显著减少。此外,这种方法比基于API的解决方案提供了更好的患者隐私保护。鉴于上述优势,本综述系统地总结了如何从更细致的角度基于开源通用大型语言模型训练医学大型语言模型。内容包括:(a) 如何获取训练语料并构建定制的医学训练集,(b) 如何选择合适的训练范式,(c) 如何选择合适的评估基准,以及 (d) 讨论现有的挑战和有前景的研究方向。此综述可为开发各种医学应用的大型语言模型提供指导,例如医学教育、诊断规划和临床助理。相关资源和补充信息可以在GitHub仓库中找到。