摘要
arXiv:2504.19565v1 交叉公告类型
摘要:生物医学研究中大型语言模型(LLMs)的迅速进步突显了现有开源标注科学语料库的局限性,这些语料库在数量和质量上往往是不足的。为应对生物医学知识复杂层次结构所带来的挑战,我们提出了一种知识驱动的多智能体框架,该框架专门针对生物医学领域中的LLM训练进行语料库精炼。我们方法的核心是一种协作性的多智能体架构,其中每个专门化的智能体,均由医学主题层次结构(MeSH)指导,共同协作自主地从海量科学文献中提取、合成和自我评估高质量的文本数据。这些智能体共同生成和改进领域特定的问题-答案对,确保全面覆盖并与生物医学本体保持一致,同时最大限度地减少人工干预。大量的实验结果显示,在我们的多智能体精炼数据集上训练的语言模型在生物医学问答任务上取得了显著的进步,优于强大的生命科学LLM基线和先进的专有模型。值得注意的是,我们的AI就绪数据集使得Llama3-70B在MedPrompt和Med-PaLM-2的帮助下超越了GPT-4,尽管后者规模更大。详细的概念验证研究和案例分析进一步验证了框架中每个智能体的有效性和协同作用,突显了多智能体协作在生物医学LLM培训中的潜力。