摘要
arXiv:2404.01663v5 类别: cross
摘要:开源大型语言模型(LLMs)在自然语言处理领域取得了显著进展,展示了在各种任务上的出色表现。尽管LLMs取得了重大进展,但它们的有效运行仍然高度依赖于人类输入以准确引导对话流程,其中代理调优是一种关键的优化技术,涉及对模型进行人工调整以更好地响应这种指导。为了解决这种依赖性,我们的工作引入了TinyAgent模型,该模型是在精心策划的高质量数据集上训练而成的。我们还提出了协作多代理调优(CMAT)框架,这是一种创新系统,旨在通过基于环境反馈的自适应权重更新来增强语言代理的能力。该框架促进了多个智能代理之间的协作学习和实时自适应,增强了它们的上下文感知能力和长期记忆。在这项研究中,我们提出了一种新的通信代理框架,将多代理系统与环境反馈机制相结合,提供了一种可扩展的方法来探索协作行为。值得一提的是,尽管TinyAgent-7B模型的参数较少,其性能堪比GPT-3.5,这表明LLMs的效率和效果有了显著提高。