LLM2D

摘要

arXiv:2502.04780v1 Announce Type: new 摘要：由大型语言模型（LLMs）驱动的多智能体AI系统越来越多地应用于解决复杂任务。然而，这些系统通常依赖于脆弱的、手工设计的提示和启发式方法，使得优化变得困难。优化多智能体系统的关键挑战之一是获取适合的训练数据来训练专门的智能体。为此，我们引入了SiriuS，这是一种自改进、基于推理的多智能体系统优化框架。在我们的方法中，核心是构建经验库：一个高质量推理轨迹的存储库。该库通过保留导致成功结果的推理步骤来构建，为优化多智能体系统提供了稳健的数据集。此外，我们还引入了一种库扩充方法，以改进不成功的轨迹，从而进一步丰富该库。SiriuS 在推理和生物医学问答任务中性能提升了 2.86% 至 21.88%，并在竞争环境中提高了智能体的谈判能力。我们的结果显示，SiriuS 在增强多智能体性能的同时，生成了可重用的数据用于未来的自我纠正和自我玩耍增强。