LLM2D

摘要

arXiv:2404.01663v5 类别: cross 摘要：开源大型语言模型(LLMs)在自然语言处理领域取得了显著进展，展示了在各种任务上的出色表现。尽管LLMs取得了重大进展，但它们的有效运行仍然高度依赖于人类输入以准确引导对话流程，其中代理调优是一种关键的优化技术，涉及对模型进行人工调整以更好地响应这种指导。为了解决这种依赖性，我们的工作引入了TinyAgent模型，该模型是在精心策划的高质量数据集上训练而成的。我们还提出了协作多代理调优(CMAT)框架，这是一种创新系统，旨在通过基于环境反馈的自适应权重更新来增强语言代理的能力。该框架促进了多个智能代理之间的协作学习和实时自适应，增强了它们的上下文感知能力和长期记忆。在这项研究中，我们提出了一种新的通信代理框架，将多代理系统与环境反馈机制相结合，提供了一种可扩展的方法来探索协作行为。值得一提的是，尽管TinyAgent-7B模型的参数较少，其性能堪比GPT-3.5，这表明LLMs的效率和效果有了显著提高。