LLM2D
带工具的大语言模型:综述
LLM With Tools: A Survey
作者: Zhuocheng Shen
发布日期: 9/30/2024
arXiv ID: oai:arXiv.org:2409.18807v1

摘要

将工具集成到大型语言模型中,为提高这些模型在处理特定复杂任务时的效率和准确性提供了一种新方法。本文深入探讨了在教导大型语言模型使用外部工具方面的方法、挑战和发展,从而将它们的能力扩展到预先存在的知识库之外。我们介绍了一种标准化的工具集成范式,该范式由一系列函数引导,这些函数将用户指令映射到可执行计划及其执行,强调理解用户意图、工具选择和动态计划调整的重要性。我们的探索揭示了遇到的各种挑战,例如工具调用时机、选择准确性和对健壮推理过程的需求。为了应对这些挑战,我们研究了微调和上下文学习范式中的技术,重点介绍了确保多样性、增强数据集和改进泛化的创新方法。此外,我们研究了使大型语言模型不仅能够利用工具,而且能够自主创建工具的视角,这可能重新定义它们的角色,从单纯的工具使用者转变为工具创造者。最后,我们重现了 Chameleon 在 ScienceQA 上的结果并分析了代码结构。