LLM2D

摘要

arXiv:2503.23037v2 宣告类型: 替换摘要：对于行为型大语言模型（agentic LLMs）存在极大的兴趣，这类模型能够充当代理。我们回顾了这一领域的日益增长的研究成果，并提供了一个研究议程。行为型大语言模型是能够在以下三个方面发挥作用的模型：(1) 推理，(2) 行动，和 (3) 互动。我们根据这三个类别组织文献。第一类研究侧重于推理、反思和检索，旨在改进决策；第二类研究侧重于行动模型、机器人和工具，旨在使代理成为有用的助手；第三类研究侧重于多代理系统，旨在实现协作任务解决，并通过模拟互动来研究新兴的社会行为。我们发现，这些类别中的工作能够相互受益：检索使工具使用成为可能，反思提高了多代理协作的效率，而推理则对所有类别都有益。我们讨论了行为型大语言模型的应用，并提供了进一步研究的议程。重要的应用包括医疗诊断、物流和金融市场分析。此外，具有自省能力的代理能够在相互扮演角色并互动中增强科学研究本身的过程。进一步而言，行为型大语言模型可能为大型语言模型耗尽训练数据的问题提供解决方案：推理时的行为能够生成新的训练状态，从而使大语言模型能够持续学习，而无需依赖越来越大的数据集。我们注意到，当大语言模型助手在真实世界中采取行动时存在风险，而行为型大语言模型也很有可能对社会产生积极影响。