摘要
arXiv:2501.18817v1 宣告类型: 新
摘要:近期大型语言模型(LLMs)演绎能力的进步显示了LLMs解决简单规划任务的能力有所增强。然而,只要提高演绎能力的动力是模型的大小和复杂性,与运行这些模型相关的财务和计算成本也将增加。这一趋势提出了持续可访问性的问题,并且表明这些改进是否将以与模型继续增长的规模和成本相同的速度推进。我们提出了两种增强较少资源密集型LLMs演绎能力的方法。(1)通过一个更资源密集型的LLM为它们提供一个适用于给定领域的通用策略,(2)利用它们的成本效益,通过迭代提示这些模型纠正它们提出的解决方案中的错误。我们从规划和数学推理任务中的实验结果证明,这些方法将较少资源密集型LLMs的性能提升到了与其更资源密集型对应物相当的水平,但成本却仅为它们的一小部分。此外,我们表明,在我们的实验中利用通用策略将较少资源密集型模型的成本平均降低了近30%。