LLM2D

摘要

arXiv:2502.00330v1 类型: cross 摘要: 近年来，在长上下文大语言模型（LLMs）方面的进展导致了多种示例上下文学习（ICL）中的新兴范式，观察到在常规的少量示例设置之外，扩展更多的演示示例可以带来性能提升。然而，尽管具有这种潜力，仍不清楚哪些方面主导了这些好处，以及是否简单地扩展到更多的示例是提高多种示例ICL最有效的方法。在这项工作中，我们首先对驱动多种示例ICL的因素进行了分析，并发现1）多种示例性能仍然可以归因于少数几个异常重要的示例，2）识别这样的重要示例（"优化"）并使用它们生成新的示例（"生成"）可以带来进一步的改进。受到这些发现的启发，我们提出了一种BRIDGE算法，该算法交替进行使用贝叶斯优化进行"优化"步骤以发现具有影响力的示例集和"生成"步骤以重新利用此集自动扩展示例的推理路径，回到多种示例范式。在不同规模的Gemini、Claude和Mistral大语言模型上，我们在符号推理、数值推理和代码生成等多样化的任务中展示了BRIDGE的显著改进。