LLM2D

摘要

在医疗领域，自然语言处理 (NLP) 在涉及小数据集、非英语语言、少量标记样本和类别不平衡的现实世界应用中可能会表现不佳。目前还没有关于如何解决这个问题的共识。我们使用三个丹麦语（一种资源匮乏的语言）癫痫患者磁共振图像放射学报告数据集，评估了一组 NLP 模型，包括类 BERT 变换器、使用句子变换器 (SetFit) 的少样本学习以及提示大型语言模型 (LLM)。我们的结果表明，目前在放射学报告目标领域预训练的类 BERT 模型为此场景提供了最佳性能。值得注意的是，与类 BERT 模型相比，SetFit 和 LLM 模型表现不佳，其中 LLM 表现最差。重要的是，所研究的模型都没有足够准确，无法在没有任何监督的情况下进行文本分类。但是，它们显示出数据过滤的潜力，这可以减少所需的手动标记量。