LLM2D

医疗领域摘要任务中大型语言模型的评估：一篇叙事综述

Evaluation of Large Language Models for Summarization Tasks in the Medical Domain: A Narrative Review

作者: Emma Croxford, Yanjun Gao, Nicholas Pellegrino, Karen K. Wong, Graham Wills, Elliot First, Frank J. Liao, Cherodeep Goswami, Brian Patterson, Majid Afshar

发布日期: 9/30/2024

arXiv ID: oai:arXiv.org:2409.18170v1

摘要

大型语言模型已经推动了临床自然语言生成的进步，为管理海量医疗文本提供了机会。然而，医学的高风险性质需要可靠的评估，而这仍然是一个挑战。本综述文章评估了目前临床摘要任务的评估现状，并针对专家人工评估的资源限制提出了未来的发展方向。

查看原文下载 PDF