LLM2D

摘要

医疗领域中，特别是罕见、复杂和危及生命的疾病，缺乏亚专科医师的专业知识给医疗服务带来了重大挑战。这个问题在心脏病学领域尤为突出，因为及时、准确的管理决定着预后。我们探索了 AMIE（Articulate Medical Intelligence Explorer）的潜力，它是一个基于大型语言模型（LLM）的实验性人工智能系统，针对诊断对话进行了优化，旨在在这个充满挑战的背景下增强和支持临床决策。我们从一个亚专科心脏病学实践中收集了一个包含 204 个复杂病例的真实世界数据集，其中包括心电图、超声心动图、心脏 MRI、基因检测和心肺压力测试的结果。我们开发了一个十个领域评估指标，由亚专科医师使用该指标评估由普通心脏病学家或 AMIE 生成的诊断和临床管理计划的质量，后者增强了网络搜索和自我批评功能。在 10 个领域中的 5 个领域，AMIE 被评为优于普通心脏病学家（偏好范围从 9% 到 20%），其余领域则与之相当。访问 AMIE 的响应提高了心脏病学家在 63.7% 的病例中的总体响应质量，而降低了 3.4% 的质量。在所有 10 个领域中，有权访问 AMIE 的心脏病学家的响应优于没有权访问 AMIE 的心脏病学家响应。定性检查表明，AMIE 和普通心脏病学家可以相互补充，AMIE 彻底而敏感，而普通心脏病学家简洁而具体。总的来说，我们的结果表明，专门的医疗 LLM 有可能通过弥合亚专科专业知识的差距来增强普通心脏病学家的能力，尽管进一步的研究和验证对于广泛的临床应用至关重要。