LLM2D

摘要

arXiv:2503.18539v1 宣告类型: cross 摘要：背景：临床自然语言处理（NLP）是指利用计算方法提取、处理和分析未结构化临床文本数据，并在各种临床任务中具有巨大的潜力以变革医疗保健。目标：本研究旨在进行一项系统回顾，全面评估和分析最新的临床NLP方法在大陆斯堪的纳维亚地区的表现。方法：于2022年12月至2024年2月期间，在PubMed、ScienceDirect、Google Scholar、ACM数字图书馆和IEEE Xplore等各个在线数据库中进行了文献搜索。此外，还参考了入选文章的相关参考文献，以加强我们的搜索。最终池包括2010年至2024年间用大陆斯堪的纳维亚语言进行临床NLP并在英语中发表的文章。结果：在这113篇文章中，21篇（占18%）关注挪威临床文本，72篇（占64%）关注瑞典，11篇（占10%）关注丹麦，9篇（占8%）涉及多种语言。总体而言，综述识别出了该地区的积极发展，尽管不同语言之间存在一些可观察到的差距和差异。在采用基于变压器的模型方面存在显著差异。在去标识化等关键任务中，针对挪威语和丹麦语正文的研究活动显著少于瑞典语文本。进一步地，综述还发现了该地区资源共享（如数据、实验代码、预训练模型）和迁移学习适应率较低的情况。结论：综述全面评估了大陆斯堪的纳维亚语言电子健康记录（EHR）文本的最新临床NLP状态，并指出了可能阻碍该地区领域快速发展的障碍和挑战。