摘要
arXiv:2309.08532v3 宣告类型: replace-cross
摘要: 大型语言模型(LLMs)在各种任务中表现出色,但它们依赖于精心设计的提示,这些提示通常需要大量的人工努力。为了自动化这一过程,本文提出了一种名为 EvoPrompt 的新颖离散提示优化框架,该框架借鉴了进化算法(EAs)的思想,因为它们在性能和快速收敛方面表现出色。为了使 EAs 能够应用于离散提示,这些提示是需要连贯且可读的自然语言表达,我们将 LLMs 与 EAs 相结合。这种方法使我们能够同时利用 LLM 强大的语言处理能力以及 EAs 高效的优化性能。具体来说,EvoPrompt 不使用任何梯度或参数,从一组初始提示开始,并基于进化操作使用 LLM 逐步生成新的提示,并根据开发集改进这一群体。我们在闭源和开源 LLMs(包括 GPT-3.5 和 Alpaca)上使用 31 个数据集对提示进行了优化,这些数据集涵盖了语言理解、生成任务以及 BIG-Bench Hard(BBH)任务。EvoPrompt 显著优于人工设计的提示和现有的自动提示生成方法(例如,在 BBH 上最高可达 25%)。此外,EvoPrompt 证明了将 LLMs 与 EAs 相结合可以产生协同效应,这可能激发未来关于 LLMs 和传统算法组合的研究。