LLM2D

摘要

arXiv:2504.11788v1 宣告类型: cross 摘要：随着大型语言模型的最近进步，网络代理已经得到了极大的改进。然而，处理复杂和动态的网络环境需要更高级的规划和搜索能力。之前的研究所通常采用贪婪的一次性搜索策略，这可能导致在错误状态中难以恢复。在本工作中，我们通过引入显式的回滚机制增强网络代理，使其能够回到导航轨迹中的先前状态。该机制赋予模型直接控制搜索过程的灵活性，从而实现有效的和高效的网络导航方法。我们在两个实时网络导航基准上进行了零样本和微调设置的实验。结果证实了我们提出的这种方法的有效性。