LLM2D

摘要

大型语言模型 (LLM) 的卓越能力使其在现实世界的医疗应用中越来越具有吸引力。然而，在医疗应用中使用 LLM 的风险尚未得到系统性地描述。我们提出了五个确保医疗 AI 安全可靠的关键原则：真实性、弹性、公平性、稳健性和隐私性，以及十个具体方面。在此综合框架下，我们引入了一个包含 1000 个专家验证问题的全新 MedGuard 基准。我们对 11 个常用 LLM 的评估表明，目前的语言模型，无论其安全性对齐机制如何，在大多数基准测试中的表现普遍较差，尤其与人类医生的高水平表现相比。尽管最近的报告表明，像 ChatGPT 这样的高级 LLM 可以在各种医疗任务中匹配甚至超越人类的表现，但这项研究强调了重大的安全差距，突出了人类监督和实施 AI 安全防护措施的迫切需要。