LLM2D
基于搜索的LLM测试时计算综述:任务、LLM配置、搜索算法及相关框架
A Survey on LLM Test-Time Compute via Search: Tasks, LLM Profiling, Search Algorithms, and Relevant Frameworks
作者: Xinzhe Li
发布日期: 4/29/2025
arXiv ID: oai:arXiv.org:2501.10069v4

摘要

arXiv:2501.10069v4 宣告类型: 替换 摘要:通过搜索进行大规模语言模型测试时的计算(或大规模语言模型推理)已经成为了充满 promise 的研究领域,伴随着迅速的发展。然而,当前的框架在任务定义、大规模语言模型(LLM)剖析和搜索程序三个方面通常采取不同的视角,这使得直接比较变得困难。此外,所使用的搜索算法往往与标准实现有所不同,并且其具体的特性也没有被充分说明。本文综述旨在提供一个全面但整合的技术审查,涵盖现有的 LIS 框架。具体来说,我们统一了任务定义在马尔可夫决策过程(MDP)之下,并提供了大型语言模型剖析和搜索程序的模块化定义。这些定义使得各种大型语言模型推理框架之间能够进行精确比较,同时突出了它们与传统搜索算法的区别。我们还讨论了这些方法的应用性、性能和效率。对于论文的最新更新,请参考我们的 GitHub 存储库:https://github.com/xinzhel/LLM-Search。