摘要
利用大型语言模型(LLM)工具对于将AI智能体应用于现实世界至关重要。目前普遍采用的方法包括使用演示进行少样本提示或使用专家标注进行微调。然而,仅仅依靠上下文演示可能无法涵盖复杂工具和任务所需的足够知识。此外,由于专家标注成本高昂且难以泛化到新工具,因此基于解决方案路径的训练也受到阻碍。可泛化工具使用的核心挑战在于理解工具的“元”特性或基本性质,这些特性可在不同任务中转移,例如因果关系和约束条件。本文提出了一种名为MetaTool的新型工具学习方法,旨在实现跨任何可重用工具集的泛化。我们的方法结合了一种源自一系列元任务的自监督增强技术,这涉及预测工具执行过程中被掩盖的元素。该自监督程序能够大规模生成高质量的QA数据,这对于监督工具理解非常方便。通过将元任务数据融入面向任务的训练中,我们的方法显著提高了开源LLM的性能,在基于工具的规划和聊天场景中均取得了与ChatGPT相当的结果。通过大规模指令微调,MetaTool模型在新的任务上展现了令人印象深刻的零样本泛化能力。