摘要
arXiv:2404.07738v2 通知类型: 交叉替换
摘要:科学研发的步伐对于提高人类生活至关重要,但它往往是复杂、缓慢的,并需要特定的专业知识。与此同时,新颖且具有重大影响的研究通常源自对以前工作的深刻理解以及不同领域和学科之间思想的交叉融合。为了增强研究人员的生产力,我们提出了 ResearchAgent,该系统利用大型语言模型(LLMs)的百科知识和语言推理能力,来帮助他们进行研究工作。该系统自动定义新颖的问题,提出方法并设计实验,并根据协作的 LLM 助力审查代理的反馈进行迭代优化。具体来说,从一篇核心科学论文开始,ResearchAgent 不仅通过学术图谱连接相关信息,还通过知识存储中的实体来增强,这些实体是从大量论文中提取的共享基本概念中提取出来的。然后,我们借鉴了科学上以同行讨论来改进想法的方法,利用多个基于 LLM 的审查代理来进行迭代修订过程并提供审查和反馈。这些审查代理以与人类偏好一致的 LLM 实例化,其评估标准是通过 LLM 催化从实际人类判断中提取出来的。我们在多个学科的科学出版物上实验验证了我们的 ResearchAgent,展示了它在基于人类和模型评估结果生成新颖、清晰且符合实际想法方面的有效性。我们初步通过人工智能介导的科学研究为未来旨在支持研究人员在创新想法和实际操作中的系统的开发提供了重要启示。