LLM2D
从对比提示中学习:自动化优化与适应
Learning from Contrastive Prompts: Automated Optimization and Adaptation
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.15199v1

摘要

随着大型语言模型(LLMs)的发展,大量精力被用于手动设计提示。尽管现有的提示优化方法自动化了这一过程,但它们仅依赖于从错误样本中学习,导致性能次优。此外,文献中未被探索的一个挑战是,先前模型有效的提示在新版本或不同语言中可能表现不佳。我们提出了对比提示学习(LCP)框架,以解决这些差距,增强提示优化和适应性。LCP利用对比学习通过分析好提示和坏提示的示例来生成有效提示。我们在Big-Bench Hard数据集上的评估显示,LCP在提示优化方面的胜率超过76%,并且在不同模型版本、系列和语言中表现出强大的适应性。LCP为提示工程提供了一种系统化的方法,减少了在不同情境下部署LLMs所需的手动工作量。