摘要
arXiv:2502.03298v1 宣告类型: cross
摘要: 虽然增加患者对医疗文档的访问可以提高医疗服务的质量,但这一好处受到了患者健康素养水平和复杂医疗术语的限制。大型语言模型(LLMs)通过简化医疗信息提供了解决方案。然而,由于缺乏标准化的评估资源,对LLMs进行安全且患者友好的文本生成评估是困难的。为填补这一空白,我们开发了MeDiSumQA。MeDiSumQA是从MIMIC-IV出院总结通过自动化管道创建的数据集,该管道结合了基于LLM的问题-答案生成与人工质量检查。我们使用此数据集评估各种面向患者的问答任务。我们的研究发现表明,通用用途的LLMs通常会超越医学适应型模型,而自动化指标与人类判断相关。通过在PhysioNet上发布MeDiSumQA,我们旨在推进LLMs的发展,以增强患者的理解并最终改善护理结果。