摘要
arXiv:2505.07512v1 交叉公告类型
摘要:大型语言模型(LLMs)的工具使用能力使它们能够访问最新的外部信息并处理复杂任务。当前增强这种能力的方法主要依赖于通过数据合成提炼高级模型。然而,这种方法伴随着高级模型使用带来的显著成本,并且经常由于高级模型与目标模型的知识范围差异大而导致数据兼容性问题。为了应对这些挑战,我们提出了一种自我提升框架ToolACE-DEV,用于工具学习。首先,我们将工具学习目标分解为增强基本工具制作和使用能力的子任务。然后,我们引入了一种自我演化的范式,允许轻量级模型自我提升,减少对高级LLM的依赖。广泛的实验验证了我们方法在不同规模和架构模型上的有效性。