摘要
arXiv:2502.01059v1 Announce Type: cross
摘要:生物数据处理工具的发展和大型语言模型(LLMs)的出现,为利用AI在植物科学研究中提供了新的可能性,有可能显著促进知识整合和研究缺口的识别。然而,当前的LLMs在处理光合作用研究中的复杂生物数据和理论模型方面存在困难,经常无法提供准确的科学背景。因此,本研究基于OpenAI的GPT-4o提出了一个基于检索增强生成(RAG)技术和提示优化的光合作用研究助手(PRAG)。在提示优化过程中使用向量数据库和自动反馈循环,以提高与光合作用相关查询回应的准确性和相关性。PRAG在五个与科学写作相关的指标上平均提高了8.7%,源透明度提高了25.4%。此外,其科学深度和领域覆盖率与光合作用研究论文相当。使用知识图谱结构化PRAG的响应,将其与数据库内外的论文进行匹配,使得PRAG能够分别匹配数据库和测试论文中的63%和39.5%的关键实体。PRAG可以应用于光合作用研究以及更广泛的植物科学领域,为更深入的数据分析和预测能力铺平了道路。