摘要
arXiv:2504.13032v1 通知类型: 新
摘要: recently在大型语言模型(LLMs)方面取得的进展使它们得以作为规划复杂任务的代理使用。现有的方法通常依赖于思考-行动-观察(TAO)过程来增强LLM的性能,但这些方法往往受限于LLMs对复杂任务的有限知识。检索增强生成(RAG)通过利用外部数据库来利用检索到的信息进行生成,提供了新的机会。在本文中,我们识别了将RAG应用于任务规划的两个关键挑战(可扩展性和可迁移性)。我们提出了InstructRAG,这是一种在多智能体元增强学习框架内的新解决方案,以解决这些挑战。InstructRAG 包括一个图来组织过去指令路径(正确行动的序列),一个使用强化学习的RL-Agent 扩展图的覆盖范围以实现可扩展性,以及一个使用元学习的ML-Agent 提高任务泛化以实现可迁移性。两个智能体端到端地进行训练以优化整体规划性能。我们在四个广泛使用的任务规划数据集上的实验表明,InstructRAG 显著提高了性能并能够高效地适应新任务,相对于现有最佳方法实现了多达19.2%的性能提升。