LLM2D

摘要

arXiv:2411.04535v2 宣告类型：替换交叉摘要：外部工具帮助大型语言模型在它们通常会失败的任务中取得成功。在现有的框架中，选择工具通常依赖于简单的贪婪解码，无论模型是否已针对带有工具注释的数据进行了精细调整，还是通过上下文示例进行提示。与此相反，我们发现，收集并在适当的一组备选工具中进行选择，具有更大的潜在优势，可以导致最优选择。我们提出了基于元推理的工具选择（HEETON）系统，这是一个两阶段系统，首先使用自定义的微调语言模型头部对任务进行推理并输出候选工具。然后，在禁用自定义头部的情况下，它进行元推理（即对先前的推理过程进行推理），最终做出选择。我们展示了HEETON在一系列数学推理数据集上实现了实质性的收益，无论是分布内的还是分布外的。