摘要
大型语言模型(LLM)的应用已经远远超出了文本处理的范围,标志着一个新时代的到来,在这个时代,LLM 被视为能够在复杂环境中运作的通用代理。这些环境通常非常庞大,LLM 无法在其短期记忆中处理它们。受最近关于用工具扩展 LLM 能力的研究的启发,我们试图通过引入一种称为中间件的新型工具来调查工具在帮助 LLM 处理这种复杂性方面的诱人潜力,以帮助在这些庞大环境中进行主动探索。这种专门的工具可以充当中间件层,保护 LLM 免受环境复杂性的影响。在两个具有代表性的复杂环境——知识库(KB)和数据库——中,我们展示了在复杂环境中用工具增强语言代理的巨大潜力。值得注意的是,配备了中间件的 GPT-4 在需要访问数据库内容的任务中比最佳基线性能提高了 2.8 倍,在 KB 任务中提高了 2.2 倍。我们的发现为在现实世界应用中推进语言代理指明了方向。