LLM2D
CATP-LLM:赋能大型语言模型进行成本感知型工具规划
CATP-LLM: Empowering Large Language Models for Cost-Aware Tool Planning
作者: Duo Wu, Jinghe Wang, Yuan Meng, Yanning Zhang, Le Sun, Zhi Wang
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.16313v1

摘要

利用大型语言模型(LLM)进行工具规划已成为开发通用人工智能系统的一种有前景的方法,其中LLM根据任务描述自动调度外部工具(例如视觉模型)来处理复杂任务。为了将这种范式推向实际应用,LLM必须考虑工具执行成本(例如执行时间)进行工具规划至关重要。不幸的是,之前的研究忽略了工具执行成本,导致生成成本超过任务性能的昂贵计划。为了填补这一空白,我们提出了基于LLM的成本感知工具规划(CATP-LLM)框架,该框架首次提供了一种连贯的设计,使LLM能够进行成本感知工具规划。具体来说,CATP-LLM结合了一种工具规划语言,以增强LLM生成具有多个分支的非顺序计划,以实现高效的并发工具执行和成本降低。此外,它还设计了一种成本感知的离线强化学习算法来微调LLM,以优化工具规划中的性能成本权衡。由于缺乏公开的成本相关数据集,我们进一步提出了OpenCATP,这是一个用于成本感知规划评估的第一个平台。在OpenCATP上的实验表明,即使使用Llama2-7B作为其骨干,CATP-LLM也优于GPT-4,即使在具有挑战性的规划任务上,平均性能也提高了28.2%-30.2%,成本降低了24.7%-45.8%。CATP-LLM和OpenCATP的代码将公开发布。