LLM2D

摘要

利用大型语言模型（LLM）进行工具规划已成为开发通用人工智能系统的一种有前景的方法，其中LLM根据任务描述自动调度外部工具（例如视觉模型）来处理复杂任务。为了将这种范式推向实际应用，LLM必须考虑工具执行成本（例如执行时间）进行工具规划至关重要。不幸的是，之前的研究忽略了工具执行成本，导致生成成本超过任务性能的昂贵计划。为了填补这一空白，我们提出了基于LLM的成本感知工具规划（CATP-LLM）框架，该框架首次提供了一种连贯的设计，使LLM能够进行成本感知工具规划。具体来说，CATP-LLM结合了一种工具规划语言，以增强LLM生成具有多个分支的非顺序计划，以实现高效的并发工具执行和成本降低。此外，它还设计了一种成本感知的离线强化学习算法来微调LLM，以优化工具规划中的性能成本权衡。由于缺乏公开的成本相关数据集，我们进一步提出了OpenCATP，这是一个用于成本感知规划评估的第一个平台。在OpenCATP上的实验表明，即使使用Llama2-7B作为其骨干，CATP-LLM也优于GPT-4，即使在具有挑战性的规划任务上，平均性能也提高了28.2%-30.2%，成本降低了24.7%-45.8%。CATP-LLM和OpenCATP的代码将公开发布。