LLM2D
SLaVA-CXR:用于胸部X光报告自动化的小型语言与视觉助手
SLaVA-CXR: Small Language and Vision Assistant for Chest X-ray Report Automation
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.13321v1

摘要

arXiv:2409.13321v1 公告类型: 交叉 摘要: 受大型语言模型(LLMs)成功的启发,越来越多的研究兴趣集中在开发医疗领域中的LLMs以辅助临床医生。然而,对于医院来说,使用闭源商业LLMs涉及隐私问题,而开发开源公共LLMs需要大规模计算资源,这些资源通常有限,尤其是在资源高效地区和低收入国家。我们提出了一种开源的小型语言和视觉助手(SLaVA-CXR),可用于胸部X光报告自动化。为了高效训练一个小助手,我们首先提出了Re$^3$Training方法,该方法模拟放射科医生的认知发展,并以识别、推理和报告的方式优化模型。然后,我们引入了一种数据合成方法RADEX,该方法可以生成高质量且多样化的训练语料库,并符合隐私法规。广泛的实验表明,我们基于2.7B骨干构建的SLaVA-CXR不仅优于之前的最佳模型,而且推理效率提高了6倍。