LLM2D

摘要

arXiv:2504.13032v1 通知类型: 新摘要: recently在大型语言模型（LLMs）方面取得的进展使它们得以作为规划复杂任务的代理使用。现有的方法通常依赖于思考-行动-观察（TAO）过程来增强LLM的性能，但这些方法往往受限于LLMs对复杂任务的有限知识。检索增强生成（RAG）通过利用外部数据库来利用检索到的信息进行生成，提供了新的机会。在本文中，我们识别了将RAG应用于任务规划的两个关键挑战（可扩展性和可迁移性）。我们提出了InstructRAG，这是一种在多智能体元增强学习框架内的新解决方案，以解决这些挑战。InstructRAG 包括一个图来组织过去指令路径（正确行动的序列），一个使用强化学习的RL-Agent 扩展图的覆盖范围以实现可扩展性，以及一个使用元学习的ML-Agent 提高任务泛化以实现可迁移性。两个智能体端到端地进行训练以优化整体规划性能。我们在四个广泛使用的任务规划数据集上的实验表明，InstructRAG 显著提高了性能并能够高效地适应新任务，相对于现有最佳方法实现了多达19.2%的性能提升。