LLM2D

摘要

arXiv:2503.23037v1 宣告类型: 新摘要：在代理型大规模语言模型方面引起了极大的兴趣，这些模型作为代理进行行动。我们回顾了这一领域的 growing 体研究，并提供了研究议程。代理型 LLM 是（1）推理，（2）行动，（3）互动的 LLM。我们按照这三个类别组织文献。第一类的研究专注于推理、反思和检索，旨在提高决策质量；第二类的研究集中在行动模型、机器人和工具上，旨在实现能够作为有用助手的代理；第三类的研究集中在多代理系统上，旨在实现协作任务解决，并通过模拟互动来研究涌现的社会行为。我们发现，这些类别的工作相互受益：检索使工具使用成为可能，反思提高了多代理合作的效果，而推理对所有类别都有益。我们讨论了代理型 LLM 的应用，并为未来的研究提出了议程。重要的应用包括医疗诊断、物流和金融市场分析。同时，具有自我反思能力的代理相互扮演角色并互动，可以增强科学研究本身的过程。此外，代理型 LLM 可能为 LLM 用尽训练数据的问题提供解决方案：推断时的行为产生新的训练状态，使得 LLM 能够持续学习，而无需永远更大的数据集。我们注意到，LLM 辅助在现实世界中采取行动存在风险，但代理型 LLM 也可能造福社会。