摘要
arXiv:2502.12926v1 通告类型: new
摘要:基于大规模语言模型(LLM)的代理已经在广泛的应用场景中展示了解决复杂任务的显著成功。然而,在特定上下文场景,如专业化行业或研究领域,它们的表现往往因缺乏相关领域的知识而减弱,导致结果不够精确或不理想。为了解决这一挑战,我们的工作提出了一种系统性的方法,旨在通过优化代理的底层提示来增强基于LLM的代理的上下文适应性,这些提示是决定代理行为、角色和交互的关键组成部分。手动为特定上下文任务优化提示既耗时又容易出错,且缺乏可扩展性。在这项工作中,我们提出了一种提取生成器框架,旨在自动化优化上下文条件下的LLM代理。我们的方法通过两个关键阶段进行操作:(i)从高质量输入-输出示例数据集提取特征,以及(ii)通过一种高层优化策略生成提示,该策略通过迭代识别表现不佳的案例并应用自我改进技术来促进。该框架通过使提示适应性更为精确,在多种输入尤其是特定上下文任务中提供了更可靠的表现,特别是对于维护语义一致性和最小化错误传播至关重要。尽管该方法最初是针对单阶段工作流开发的,但它的方法自然适用于多阶段工作流,为各种基于代理的系统提供了广泛的应用前景。实证评估表明,我们的框架显著改进了提示优化代理的表现,提供了一种结构化且高效的方法来解决基于上下文的语言模型代理问题。