LLM2D
从少量到众多:通过迭代优化和生成实现的自我提升多-shot推理器
From Few to Many: Self-Improving Many-Shot Reasoners Through Iterative Optimization and Generation
作者: Xingchen Wan, Han Zhou, Ruoxi Sun, Hootan Nakhost, Ke Jiang, Sercan \"O. Ar{\i}k
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2502.00330v1

摘要

arXiv:2502.00330v1 类型: cross 摘要: 近年来,在长上下文大语言模型(LLMs)方面的进展导致了多种示例上下文学习(ICL)中的新兴范式,观察到在常规的少量示例设置之外,扩展更多的演示示例可以带来性能提升。然而,尽管具有这种潜力,仍不清楚哪些方面主导了这些好处,以及是否简单地扩展到更多的示例是提高多种示例ICL最有效的方法。在这项工作中,我们首先对驱动多种示例ICL的因素进行了分析,并发现1)多种示例性能仍然可以归因于少数几个异常重要的示例,2)识别这样的重要示例("优化")并使用它们生成新的示例("生成")可以带来进一步的改进。受到这些发现的启发,我们提出了一种BRIDGE算法,该算法交替进行使用贝叶斯优化进行"优化"步骤以发现具有影响力的示例集和"生成"步骤以重新利用此集自动扩展示例的推理路径,回到多种示例范式。在不同规模的Gemini、Claude和Mistral大语言模型上,我们在符号推理、数值推理和代码生成等多样化的任务中展示了BRIDGE的显著改进。