LLM2D
挪威语、瑞典语和丹麦语电子健康记录中的自然语言处理:Norwegian, Swedish and Danish
Natural Language Processing for Electronic Health Records in Scandinavian Languages: Norwegian, Swedish, and Danish
作者: Ashenafi Zebene Woldaregay, J{\o}rgen Aarmo Lund, Phuong Dinh Ngo, Mariyam Tayefi, Joel Burman, Stine Hansen, Martin Hylleholt Sillesen, Hercules Dalianis, Robert Jenssen, Lindsetmo Rolf Ole, Karl {\O}yvind Mikalsen
发布日期: 3/25/2025
arXiv ID: oai:arXiv.org:2503.18539v1

摘要

arXiv:2503.18539v1 宣告类型: cross 摘要:背景:临床自然语言处理(NLP)是指利用计算方法提取、处理和分析未结构化临床文本数据,并在各种临床任务中具有巨大的潜力以变革医疗保健。目标:本研究旨在进行一项系统回顾,全面评估和分析最新的临床NLP方法在大陆斯堪的纳维亚地区的表现。方法:于2022年12月至2024年2月期间,在PubMed、ScienceDirect、Google Scholar、ACM数字图书馆和IEEE Xplore等各个在线数据库中进行了文献搜索。此外,还参考了入选文章的相关参考文献,以加强我们的搜索。最终池包括2010年至2024年间用大陆斯堪的纳维亚语言进行临床NLP并在英语中发表的文章。结果:在这113篇文章中,21篇(占18%)关注挪威临床文本,72篇(占64%)关注瑞典,11篇(占10%)关注丹麦,9篇(占8%)涉及多种语言。总体而言,综述识别出了该地区的积极发展,尽管不同语言之间存在一些可观察到的差距和差异。在采用基于变压器的模型方面存在显著差异。在去标识化等关键任务中,针对挪威语和丹麦语正文的研究活动显著少于瑞典语文本。进一步地,综述还发现了该地区资源共享(如数据、实验代码、预训练模型)和迁移学习适应率较低的情况。结论:综述全面评估了大陆斯堪的纳维亚语言电子健康记录(EHR)文本的最新临床NLP状态,并指出了可能阻碍该地区领域快速发展的障碍和挑战。