摘要
arXiv:2505.07917v1 交叉类型公告
摘要:生物医学问答(QA)系统需要有效的检索和生成组件,以确保准确性、效率和扩展性。本研究系统地检查了生物医学QA的检索增强生成(RAG)系统,评估了检索策略和响应时间的权衡。我们首先评估了最先进的检索方法,包括BM25、BioBERT、MedCPT以及混合方法,以及常见的数据存储解决方案,如Elasticsearch、MongoDB和FAISS,使用PubMed的约10%子集(240万文档),以衡量整体检索效率、检索延迟和端到端RAG系统的检索器性能。基于这些见解,我们在完整的2400万PubMed语料库上部署了最终的RAG系统,比较了不同检索器对整体性能的影响。检索深度评估显示,在使用MedCPT重新排序之前,通过BM25检索50篇文档可以最佳地平衡准确度(0.90)、召回率(0.90)和响应时间(1.91秒)。BM25检索时间保持稳定(82毫秒),而MedCPT则承担主要的计算成本。这些结果突显了生物医学QA中检索深度、效率和扩展性之前的之前不为人知的权衡。通过开源代码,该系统可以完全重现和扩展。