LLM2D

摘要

arXiv:2504.16273v1 宣布类型: 新摘要：大语言模型（LLMs）在临床决策支持方面显示出了潜力，但在分流应用方面仍然尚未得到充分探索。我们通过两个关键维度系统地研究了LLMs在急诊部门分流中的能力：（1）面对分布偏移和缺失数据的鲁棒性，以及（2）跨性别和种族的交割偏见的反事实分析。我们评估了多种基于LLM的方法，包括继续预训练和上下文学习，以及机器学习方法。我们的结果显示LLMs表现出更优越的鲁棒性，并探讨了促成这些有前景的LLM方法的关键因素。此外，在这种情况下，我们识别出了LLMs偏好中的特定交集，特别是在性别和种族的特定交集中。LLMs通常表现出性别差异，但在某些种族群体中最为明显。这些发现表明，LLMs编码了与特定临床场景或特定特征组合相关的偏好。