LLM2D

摘要

工具学习旨在通过外部工具增强和扩展大型语言模型 (LLM) 的能力，近年来引起了广泛关注。当前方法表明，LLM 可以通过上下文学习或微调有效地处理一定数量的工具。然而，在现实世界场景中，工具数量通常非常多且更新不规律，强调了专门的工具检索组件的必要性。由于以下挑战，工具检索并非易事：1) 复杂的用户指令和工具描述；2) 工具检索和工具使用模型之间的错位。为了解决上述问题，我们建议通过大型语言模型的迭代反馈来增强工具检索。具体来说，我们提示工具使用模型，即 LLM，在多轮中为工具检索模型提供反馈，这可以逐步提高工具检索模型对指令和工具的理解，并缩小两个独立组件之间的差距。我们构建了一个统一且全面的基准来评估工具检索模型。大量实验表明，我们提出的方法在域内评估和域外评估中都取得了先进的性能。