LLM2D
保障安全与信任:分析大型语言模型在医学领域的风险
Ensuring Safety and Trust: Analyzing the Risks of Large Language Models in Medicine
作者: Yifan Yang, Qiao Jin, Robert Leaman, Xiaoyu Liu, Guangzhi Xiong, Maame Sarfo-Gyamfi, Changlin Gong, Santiago Ferri\`ere-Steinert, W. John Wilbur, Xiaojun Li, Jiaxin Yuan, Bang An, Kelvin S. Castro, Francisco Erramuspe \'Alvarez, Mat\'ias Stockle, Aidong Zhang, Furong Huang, Zhiyong Lu
发布日期: 11/25/2024
arXiv ID: oai:arXiv.org:2411.14487v1

摘要

大型语言模型 (LLM) 的卓越能力使其在现实世界的医疗应用中越来越具有吸引力。然而,在医疗应用中使用 LLM 的风险尚未得到系统性地描述。我们提出了五个确保医疗 AI 安全可靠的关键原则:真实性、弹性、公平性、稳健性和隐私性,以及十个具体方面。在此综合框架下,我们引入了一个包含 1000 个专家验证问题的全新 MedGuard 基准。我们对 11 个常用 LLM 的评估表明,目前的语言模型,无论其安全性对齐机制如何,在大多数基准测试中的表现普遍较差,尤其与人类医生的高水平表现相比。尽管最近的报告表明,像 ChatGPT 这样的高级 LLM 可以在各种医疗任务中匹配甚至超越人类的表现,但这项研究强调了重大的安全差距,突出了人类监督和实施 AI 安全防护措施的迫切需要。