LLM2D
探究大型语言模型在临床分流中的应用:潜在能力与持续的交叉偏见
Investigating LLMs in Clinical Triage: Promising Capabilities, Persistent Intersectional Biases
作者: Joseph Lee, Tianqi Shang, Jae Young Baik, Duy Duong-Tran, Shu Yang, Lingyao Li, Li Shen
发布日期: 4/24/2025
arXiv ID: oai:arXiv.org:2504.16273v1

摘要

arXiv:2504.16273v1 宣布类型: 新 摘要:大语言模型(LLMs)在临床决策支持方面显示出了潜力,但在分流应用方面仍然尚未得到充分探索。我们通过两个关键维度系统地研究了LLMs在急诊部门分流中的能力:(1)面对分布偏移和缺失数据的鲁棒性,以及(2)跨性别和种族的交割偏见的反事实分析。我们评估了多种基于LLM的方法,包括继续预训练和上下文学习,以及机器学习方法。我们的结果显示LLMs表现出更优越的鲁棒性,并探讨了促成这些有前景的LLM方法的关键因素。此外,在这种情况下,我们识别出了LLMs偏好中的特定交集,特别是在性别和种族的特定交集中。LLMs通常表现出性别差异,但在某些种族群体中最为明显。这些发现表明,LLMs编码了与特定临床场景或特定特征组合相关的偏好。