LLM2D

摘要

arXiv:2309.08532v3 宣告类型: replace-cross 摘要: 大型语言模型（LLMs）在各种任务中表现出色，但它们依赖于精心设计的提示，这些提示通常需要大量的人工努力。为了自动化这一过程，本文提出了一种名为 EvoPrompt 的新颖离散提示优化框架，该框架借鉴了进化算法（EAs）的思想，因为它们在性能和快速收敛方面表现出色。为了使 EAs 能够应用于离散提示，这些提示是需要连贯且可读的自然语言表达，我们将 LLMs 与 EAs 相结合。这种方法使我们能够同时利用 LLM 强大的语言处理能力以及 EAs 高效的优化性能。具体来说，EvoPrompt 不使用任何梯度或参数，从一组初始提示开始，并基于进化操作使用 LLM 逐步生成新的提示，并根据开发集改进这一群体。我们在闭源和开源 LLMs（包括 GPT-3.5 和 Alpaca）上使用 31 个数据集对提示进行了优化，这些数据集涵盖了语言理解、生成任务以及 BIG-Bench Hard（BBH）任务。EvoPrompt 显著优于人工设计的提示和现有的自动提示生成方法（例如，在 BBH 上最高可达 25%）。此外，EvoPrompt 证明了将 LLMs 与 EAs 相结合可以产生协同效应，这可能激发未来关于 LLMs 和传统算法组合的研究。