LLM2D
BioMaze:评估与增强用于生物途径推理的大语言模型
BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning
作者: Haiteng Zhao, Chang Ma, Fangzhi Xu, Lingpeng Kong, Zhi-Hong Deng
发布日期: 4/17/2025
arXiv ID: oai:arXiv.org:2502.16660v4

摘要

arXiv:2502.16660v4 宣传类型:替换交叉 摘要:近年来,大规模语言模型(LLMs)在各种生物领域的应用得到了探索,但它们在复杂生物系统中的推理能力,如通路系统的推理能力,仍然很少被探索,这对于预测生物现象、提出假设和设计实验至关重要。本研究探讨了LLMs在通路推理方面的潜力。我们介绍了BioMaze数据集,包含来自真实研究的5100个复杂通路问题,涵盖了各种生物背景,包括自然动态变化、干扰、额外的干预条件以及多尺度研究目标。对CoT和图增强推理等方法的评估表明,LLMs在通路推理方面面临挑战,尤其是在受扰动的系统中。为解决这一问题,我们提出了一种名为PathSeeker的LLM代理模型,通过基于子图的交互式导航增强推理,能够更有效地处理生物系统中的复杂性,实现科学对齐的方法。数据集和代码可在https://github.com/zhao-ht/BioMaze获取。