摘要
在医疗领域,自然语言处理 (NLP) 在涉及小数据集、非英语语言、少量标记样本和类别不平衡的现实世界应用中可能会表现不佳。目前还没有关于如何解决这个问题的共识。我们使用三个丹麦语(一种资源匮乏的语言)癫痫患者磁共振图像放射学报告数据集,评估了一组 NLP 模型,包括类 BERT 变换器、使用句子变换器 (SetFit) 的少样本学习以及提示大型语言模型 (LLM)。我们的结果表明,目前在放射学报告目标领域预训练的类 BERT 模型为此场景提供了最佳性能。值得注意的是,与类 BERT 模型相比,SetFit 和 LLM 模型表现不佳,其中 LLM 表现最差。重要的是,所研究的模型都没有足够准确,无法在没有任何监督的情况下进行文本分类。但是,它们显示出数据过滤的潜力,这可以减少所需的手动标记量。