LLM2D

摘要

arXiv:2505.04388v1 宣告类型: 横跨多个领域摘要：目的：随着大型语言模型（LLMs）在医疗保健领域的进步，出现了需要竞争性的开源模型以保护公共利益的需求。这项工作通过优化数据预处理和训练的关键阶段，以及展示了通过DPO提高模型安全性并通过RAG提高有效性的方法，对开放医学LLMs领域做出了贡献。所采用的评估方法包括四种不同类型的测试，从而为该领域奠定了新的标准。这些模型被证明与最佳的私营替代品相竞争，并以宽松的许可协议发布。方法：基于强大的基础模型如Llama 3.1和Qwen 2.5，Aloe Beta使用一个自定义的数据集提高公共数据与合成的推理链示例的结合。这些模型通过直接偏好优化进行了对齐，强调在存在破解攻击时的伦理和政策一致性表现。评估包括闭合式评估、开放式评估、安全性评估和人类评估，以最大化结果的可靠性。结果：基于Aloe家族的稳定性能，提出了整个工作流程的建议。这些模型在各类医疗保健基准测试和医疗领域中提供竞争力的性能，并经常受到医疗保健专业人士的青睐。在偏见和毒性方面，Aloe Beta模型显著提高了安全性，显示了对未见过的破解攻击的韧性。为了负责任地发布，附上了针对医疗保健的详细风险评估，作为Aloe家族模型的一部分。结论：Aloe Beta模型及其生成方法是对开放源代码医学LLM领域的重大贡献，它们提供顶级性能同时满足高标准的伦理要求。这项工作为医疗领域的开发和报告对齐LLM设立了新的标准。