LLM2D

摘要

arXiv:2505.07917v1 交叉类型公告摘要：生物医学问答（QA）系统需要有效的检索和生成组件，以确保准确性、效率和扩展性。本研究系统地检查了生物医学QA的检索增强生成（RAG）系统，评估了检索策略和响应时间的权衡。我们首先评估了最先进的检索方法，包括BM25、BioBERT、MedCPT以及混合方法，以及常见的数据存储解决方案，如Elasticsearch、MongoDB和FAISS，使用PubMed的约10%子集（240万文档），以衡量整体检索效率、检索延迟和端到端RAG系统的检索器性能。基于这些见解，我们在完整的2400万PubMed语料库上部署了最终的RAG系统，比较了不同检索器对整体性能的影响。检索深度评估显示，在使用MedCPT重新排序之前，通过BM25检索50篇文档可以最佳地平衡准确度（0.90）、召回率（0.90）和响应时间（1.91秒）。BM25检索时间保持稳定（82毫秒），而MedCPT则承担主要的计算成本。这些结果突显了生物医学QA中检索深度、效率和扩展性之前的之前不为人知的权衡。通过开源代码，该系统可以完全重现和扩展。