LLM2D

摘要

arXiv:2409.15127v3 公开类型: 重新提交摘要：本研究利用优化了的上下文检索来增强开源大型语言模型（LLMs），以实现成本效益高且高性能的医疗AI。我们证明，这种方法在医疗问答任务上达到了最先进的准确率，成本仅为专有模型的一小部分，并在MedQA基准上显著改善了成本-准确率的帕累托前沿。主要贡献包括：(1) 开放医疗QA (OpenMedQA)，一种新颖的基准，揭示了开放式医疗问答与选择题格式之间的性能差距；(2) 一种实用且可复制的上下文检索优化管道；以及 (3) 开放源代码资源（提示引擎、CoT/ToT/思考数据库），以促进医疗AI的发展。通过推进检索技术和问答评估，我们使更经济实惠且可靠的LLM解决方案能够应用于医疗领域。