摘要
arXiv:2409.15127v3 公开类型: 重新提交
摘要:本研究利用优化了的上下文检索来增强开源大型语言模型(LLMs),以实现成本效益高且高性能的医疗AI。我们证明,这种方法在医疗问答任务上达到了最先进的准确率,成本仅为专有模型的一小部分,并在MedQA基准上显著改善了成本-准确率的帕累托前沿。主要贡献包括:(1) 开放医疗QA (OpenMedQA),一种新颖的基准,揭示了开放式医疗问答与选择题格式之间的性能差距;(2) 一种实用且可复制的上下文检索优化管道;以及 (3) 开放源代码资源(提示引擎、CoT/ToT/思考数据库),以促进医疗AI的发展。通过推进检索技术和问答评估,我们使更经济实惠且可靠的LLM解决方案能够应用于医疗领域。