LLM2D
大型语言模型决策能力研究:多智能体环境下游戏能力评估
How Far Are We on the Decision-Making of LLMs? Evaluating LLMs' Gaming Ability in Multi-Agent Environments
作者: Jen-tse Huang, Eric John Li, Man Ho Lam, Tian Liang, Wenxuan Wang, Youliang Yuan, Wenxiang Jiao, Xing Wang, Zhaopeng Tu, Michael R. Lyu
发布日期: 10/2/2024
arXiv ID: oai:arXiv.org:2403.11807v4

摘要

大型语言模型 (LLMs) 在许多自然语言处理任务中取代了传统方法。然而,在命名实体识别 (NER) 中,现有的基于 LLMs 的方法...