摘要
arXiv:2505.04388v1 宣告类型: 横跨多个领域
摘要:目的:随着大型语言模型(LLMs)在医疗保健领域的进步,出现了需要竞争性的开源模型以保护公共利益的需求。这项工作通过优化数据预处理和训练的关键阶段,以及展示了通过DPO提高模型安全性并通过RAG提高有效性的方法,对开放医学LLMs领域做出了贡献。所采用的评估方法包括四种不同类型的测试,从而为该领域奠定了新的标准。这些模型被证明与最佳的私营替代品相竞争,并以宽松的许可协议发布。
方法:基于强大的基础模型如Llama 3.1和Qwen 2.5,Aloe Beta使用一个自定义的数据集提高公共数据与合成的推理链示例的结合。这些模型通过直接偏好优化进行了对齐,强调在存在破解攻击时的伦理和政策一致性表现。评估包括闭合式评估、开放式评估、安全性评估和人类评估,以最大化结果的可靠性。
结果:基于Aloe家族的稳定性能,提出了整个工作流程的建议。这些模型在各类医疗保健基准测试和医疗领域中提供竞争力的性能,并经常受到医疗保健专业人士的青睐。在偏见和毒性方面,Aloe Beta模型显著提高了安全性,显示了对未见过的破解攻击的韧性。为了负责任地发布,附上了针对医疗保健的详细风险评估,作为Aloe家族模型的一部分。
结论:Aloe Beta模型及其生成方法是对开放源代码医学LLM领域的重大贡献,它们提供顶级性能同时满足高标准的伦理要求。这项工作为医疗领域的开发和报告对齐LLM设立了新的标准。