LLM2D

摘要

自然语言处理 (NLP) 系统正越来越多地采用复杂的模块化管道形式，例如检索增强生成 (RAG)，其中每个模块可能包含一个独立的语言模型 (LM) 和一个相关的提示模板。这些复合系统通常缺乏中间标签或梯度流来优化每个模块，这使得它们的端到端优化具有挑战性。在这里，我们寻求策略来优化这些系统的模块级 LM 权重和相关提示模板，以最大限度地提高下游任务指标。我们首次提出将权重和提示优化策略相结合来优化模块化 LM 管道，通过在两者之间交替，使同一个 LM 自行学习。在使用 mistral-7b、llama-2-7b 和 llama-3-8b 进行多跳问答、数学推理和基于特征的分类的实验中，这些 BetterTogether 策略共同优化了管道的权重和提示，其性能优于单独优化权重和单独优化提示，平均而言，在 LM 和任务上分别提高了 60% 和 6%。BetterTogether 优化器在 DSPy 中发布，网址为 http://dspy.ai。