摘要
工具学习旨在通过外部工具增强和扩展大型语言模型 (LLM) 的能力,近年来引起了广泛关注。当前方法表明,LLM 可以通过上下文学习或微调有效地处理一定数量的工具。然而,在现实世界场景中,工具数量通常非常多且更新不规律,强调了专门的工具检索组件的必要性。由于以下挑战,工具检索并非易事:1) 复杂的用户指令和工具描述;2) 工具检索和工具使用模型之间的错位。为了解决上述问题,我们建议通过大型语言模型的迭代反馈来增强工具检索。具体来说,我们提示工具使用模型,即 LLM,在多轮中为工具检索模型提供反馈,这可以逐步提高工具检索模型对指令和工具的理解,并缩小两个独立组件之间的差距。我们构建了一个统一且全面的基准来评估工具检索模型。大量实验表明,我们提出的方法在域内评估和域外评估中都取得了先进的性能。