摘要
arXiv:2501.10069v4 宣告类型: 替换
摘要:通过搜索进行大规模语言模型测试时的计算(或大规模语言模型推理)已经成为了充满 promise 的研究领域,伴随着迅速的发展。然而,当前的框架在任务定义、大规模语言模型(LLM)剖析和搜索程序三个方面通常采取不同的视角,这使得直接比较变得困难。此外,所使用的搜索算法往往与标准实现有所不同,并且其具体的特性也没有被充分说明。本文综述旨在提供一个全面但整合的技术审查,涵盖现有的 LIS 框架。具体来说,我们统一了任务定义在马尔可夫决策过程(MDP)之下,并提供了大型语言模型剖析和搜索程序的模块化定义。这些定义使得各种大型语言模型推理框架之间能够进行精确比较,同时突出了它们与传统搜索算法的区别。我们还讨论了这些方法的应用性、性能和效率。对于论文的最新更新,请参考我们的 GitHub 存储库:https://github.com/xinzhel/LLM-Search。