LLM2D

摘要

arXiv:2501.10069v4 宣告类型: 替换摘要：通过搜索进行大规模语言模型测试时的计算（或大规模语言模型推理）已经成为了充满 promise 的研究领域，伴随着迅速的发展。然而，当前的框架在任务定义、大规模语言模型（LLM）剖析和搜索程序三个方面通常采取不同的视角，这使得直接比较变得困难。此外，所使用的搜索算法往往与标准实现有所不同，并且其具体的特性也没有被充分说明。本文综述旨在提供一个全面但整合的技术审查，涵盖现有的 LIS 框架。具体来说，我们统一了任务定义在马尔可夫决策过程（MDP）之下，并提供了大型语言模型剖析和搜索程序的模块化定义。这些定义使得各种大型语言模型推理框架之间能够进行精确比较，同时突出了它们与传统搜索算法的区别。我们还讨论了这些方法的应用性、性能和效率。对于论文的最新更新，请参考我们的 GitHub 存储库：https://github.com/xinzhel/LLM-Search。