摘要
人工智能算法的进步使其在生物医学等多个领域得到应用。包括大型语言模型 (LLM) 在内的人工智能系统在药物发现方面具有特别优势,而药物发现是一个非常漫长且昂贵的过程。然而,LLM 本身缺乏对特定领域的深入了解,并且可能生成不准确的信息。此外,它们无法执行更复杂的操作,这些操作需要使用外部工具。我们的工作重点关注这两个问题。首先,我们展示了如何实现先进的 RAG 系统来帮助 LLM 生成更准确的药物发现相关问题答案。结果表明,使用 RAG 系统的 LLM 生成的答案质量超过了没有 RAG 的模型生成的答案。其次,我们展示了如何使用 LLM 创建自动目标档案,并将它们与外部工具相结合,以便它们可以执行更复杂的任务来收集数据,例如访问数据库和执行代码。结果是生成一个可投入生产的目标档案,其中包含以 PDF 和 PowerPoint 演示文稿形式汇总的获取信息。