LLM2D
CATP-LLM:为成本意识工具规划赋能的大语言模型
CATP-LLM: Empowering Large Language Models for Cost-Aware Tool Planning
作者: Duo Wu, Jinghe Wang, Yuan Meng, Yanning Zhang, Le Sun, Zhi Wang
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2411.16313v2

摘要

arXiv:2411.16313v2 宣告类型: 重写 摘要:利用大型语言模型(LLMs)进行工具规划已成为开发通用人工智能系统的一个有前途的途径,在这种途径中,LLMs根据任务描述自动调度外部工具(例如,视觉模型)来解决复杂任务。为了将这一范式推向实际应用,LLMs在工具规划时考虑工具执行成本(例如,执行时间)至关重要。不幸的是,以前的研究忽视了工具执行成本,导致生成了成本高于任务性能的昂贵计划。为了弥补这一缺口,我们提出了成本感知工具规划的大型语言模型框架(CATP-LLM),这是首次为LLMs提供了一个连贯的设计,以实现成本感知的工具规划。具体来说,CATP-LLM 接入了一种工具规划语言,以增强LLMs生成多个分支的非顺序计划,实现工具的高效并行执行和成本降低。此外,它进一步设计了一种成本感知的离线强化学习算法,以微调LLMs以优化工具规划中的性能与成本trade-off。由于缺乏公开的成本相关数据集,我们进一步介绍了OpenCATP,这是第一个用于成本感知规划评估的平台。在OpenCATP上的实验结果显示,即使使用Llama2-7B作为其骨干网络,CATP-LLM 在具有挑战性的规划任务中的平均计划性能提高了28.2%-30.2%,并且成本降低了24.7%-45.8%。代码和数据集可在 https://github.com/duowuyms/OpenCATP-LLM 获取。