LLM2D
芦荟家族菜谱:开放且专业化的 healthcare LLMs
The Aloe Family Recipe for Open and Specialized Healthcare LLMs
作者: Dario Garcia-Gasulla, Jordi Bayarri-Planas, Ashwin Kumar Gururajan, Enrique Lopez-Cuena, Adrian Tormos, Daniel Hinjos, Pablo Bernabeu-Perez, Anna Arias-Duart, Pablo Agustin Martin-Torres, Marta Gonzalez-Mallo, Sergio Alvarez-Napagao, Eduard Ayguad\'e-Parra, Ulises Cort\'es
发布日期: 5/8/2025
arXiv ID: oai:arXiv.org:2505.04388v1

摘要

arXiv:2505.04388v1 宣告类型: 横跨多个领域 摘要:目的:随着大型语言模型(LLMs)在医疗保健领域的进步,出现了需要竞争性的开源模型以保护公共利益的需求。这项工作通过优化数据预处理和训练的关键阶段,以及展示了通过DPO提高模型安全性并通过RAG提高有效性的方法,对开放医学LLMs领域做出了贡献。所采用的评估方法包括四种不同类型的测试,从而为该领域奠定了新的标准。这些模型被证明与最佳的私营替代品相竞争,并以宽松的许可协议发布。 方法:基于强大的基础模型如Llama 3.1和Qwen 2.5,Aloe Beta使用一个自定义的数据集提高公共数据与合成的推理链示例的结合。这些模型通过直接偏好优化进行了对齐,强调在存在破解攻击时的伦理和政策一致性表现。评估包括闭合式评估、开放式评估、安全性评估和人类评估,以最大化结果的可靠性。 结果:基于Aloe家族的稳定性能,提出了整个工作流程的建议。这些模型在各类医疗保健基准测试和医疗领域中提供竞争力的性能,并经常受到医疗保健专业人士的青睐。在偏见和毒性方面,Aloe Beta模型显著提高了安全性,显示了对未见过的破解攻击的韧性。为了负责任地发布,附上了针对医疗保健的详细风险评估,作为Aloe家族模型的一部分。 结论:Aloe Beta模型及其生成方法是对开放源代码医学LLM领域的重大贡献,它们提供顶级性能同时满足高标准的伦理要求。这项工作为医疗领域的开发和报告对齐LLM设立了新的标准。