LLM2D
医疗领域摘要任务中大型语言模型的评估:一篇叙事综述
Evaluation of Large Language Models for Summarization Tasks in the Medical Domain: A Narrative Review
作者: Emma Croxford, Yanjun Gao, Nicholas Pellegrino, Karen K. Wong, Graham Wills, Elliot First, Frank J. Liao, Cherodeep Goswami, Brian Patterson, Majid Afshar
发布日期: 9/30/2024
arXiv ID: oai:arXiv.org:2409.18170v1

摘要

大型语言模型已经推动了临床自然语言生成的进步,为管理海量医疗文本提供了机会。然而,医学的高风险性质需要可靠的评估,而这仍然是一个挑战。本综述文章评估了目前临床摘要任务的评估现状,并针对专家人工评估的资源限制提出了未来的发展方向。