LLM2D

摘要

arXiv:2502.03298v1 宣告类型: cross 摘要: 虽然增加患者对医疗文档的访问可以提高医疗服务的质量，但这一好处受到了患者健康素养水平和复杂医疗术语的限制。大型语言模型（LLMs）通过简化医疗信息提供了解决方案。然而，由于缺乏标准化的评估资源，对LLMs进行安全且患者友好的文本生成评估是困难的。为填补这一空白，我们开发了MeDiSumQA。MeDiSumQA是从MIMIC-IV出院总结通过自动化管道创建的数据集，该管道结合了基于LLM的问题-答案生成与人工质量检查。我们使用此数据集评估各种面向患者的问答任务。我们的研究发现表明，通用用途的LLMs通常会超越医学适应型模型，而自动化指标与人类判断相关。通过在PhysioNet上发布MeDiSumQA，我们旨在推进LLMs的发展，以增强患者的理解并最终改善护理结果。