LLM2D

摘要

arXiv:2409.13191v1 公告类型: 交叉摘要: 糖尿病是一种慢性疾病，对全球健康构成重大负担，优化糖尿病管理需要多方协作。大型语言模型（LLMs）在多种医疗场景中显示出潜力，但其在广泛糖尿病任务中的有效性仍未得到证实。在本研究中，我们引入了一个框架来训练和验证糖尿病专用LLMs。我们首先开发了一个全面的数据处理管道，包括数据收集、过滤、增强和精炼。这种方法有助于从头创建一个高质量的糖尿病专用数据集和多个评估基准。利用收集的训练数据集，我们微调了一组糖尿病专用LLM，这些模型在理解和处理各种糖尿病任务方面表现出优于其他LLM的先进能力。此外，临床研究表明，我们的模型在糖尿病护理中具有潜在应用，包括提供个性化医疗、辅助医学教育和简化临床任务。总之，我们的研究引入了一个开发和评估糖尿病专用LLM家族的框架，并强调了其在增强临床实践和为不同终端用户提供个性化、数据驱动支持方面的潜力。代码通过GitHub提供，地址为https://github.com/waltonfuture/Diabetica。