摘要
arXiv:2503.23037v1 宣告类型: 新
摘要:在代理型大规模语言模型方面引起了极大的兴趣,这些模型作为代理进行行动。我们回顾了这一领域的 growing 体研究,并提供了研究议程。代理型 LLM 是(1)推理,(2)行动,(3)互动的 LLM。我们按照这三个类别组织文献。第一类的研究专注于推理、反思和检索,旨在提高决策质量;第二类的研究集中在行动模型、机器人和工具上,旨在实现能够作为有用助手的代理;第三类的研究集中在多代理系统上,旨在实现协作任务解决,并通过模拟互动来研究涌现的社会行为。我们发现,这些类别的工作相互受益:检索使工具使用成为可能,反思提高了多代理合作的效果,而推理对所有类别都有益。我们讨论了代理型 LLM 的应用,并为未来的研究提出了议程。重要的应用包括医疗诊断、物流和金融市场分析。同时,具有自我反思能力的代理相互扮演角色并互动,可以增强科学研究本身的过程。此外,代理型 LLM 可能为 LLM 用尽训练数据的问题提供解决方案:推断时的行为产生新的训练状态,使得 LLM 能够持续学习,而无需永远更大的数据集。我们注意到,LLM 辅助在现实世界中采取行动存在风险,但代理型 LLM 也可能造福社会。