摘要
arXiv:2504.16273v1 宣布类型: 新
摘要:大语言模型(LLMs)在临床决策支持方面显示出了潜力,但在分流应用方面仍然尚未得到充分探索。我们通过两个关键维度系统地研究了LLMs在急诊部门分流中的能力:(1)面对分布偏移和缺失数据的鲁棒性,以及(2)跨性别和种族的交割偏见的反事实分析。我们评估了多种基于LLM的方法,包括继续预训练和上下文学习,以及机器学习方法。我们的结果显示LLMs表现出更优越的鲁棒性,并探讨了促成这些有前景的LLM方法的关键因素。此外,在这种情况下,我们识别出了LLMs偏好中的特定交集,特别是在性别和种族的特定交集中。LLMs通常表现出性别差异,但在某些种族群体中最为明显。这些发现表明,LLMs编码了与特定临床场景或特定特征组合相关的偏好。