LLM2D

摘要

大型语言模型（LLM）的应用已经远远超出了文本处理的范围，标志着一个新时代的到来，在这个时代，LLM 被视为能够在复杂环境中运作的通用代理。这些环境通常非常庞大，LLM 无法在其短期记忆中处理它们。受最近关于用工具扩展 LLM 能力的研究的启发，我们试图通过引入一种称为中间件的新型工具来调查工具在帮助 LLM 处理这种复杂性方面的诱人潜力，以帮助在这些庞大环境中进行主动探索。这种专门的工具可以充当中间件层，保护 LLM 免受环境复杂性的影响。在两个具有代表性的复杂环境——知识库（KB）和数据库——中，我们展示了在复杂环境中用工具增强语言代理的巨大潜力。值得注意的是，配备了中间件的 GPT-4 在需要访问数据库内容的任务中比最佳基线性能提高了 2.8 倍，在 KB 任务中提高了 2.2 倍。我们的发现为在现实世界应用中推进语言代理指明了方向。