摘要
arXiv:2406.00252v5 更新类型: 替换
摘要:本文讨论了如何构建更加理性的语言和多模态代理,以及在智能系统中定义理性标准的准则。理性是指由理性引导的品质,其特征是决策与证据和逻辑原则相一致。它在确保可靠解决问题方面起着关键作用,因为它确保解决方案既坚实又一致。尽管取得了进展,但大型语言模型(LLMs)往往在理性方面存在不足,这是由于它们的知识范围有限以及输出不一致所致。作为回应,最近的努力转向开发多模态和多代理系统,并整合了外部工具模块、编程代码、符号推理器、效用函数和一致性风险控制等元素,而不是仅仅依赖单一的LLM进行决策。本文综述了语言和多模态代理的最新进展,评估了它们在增强理性方面的作用,并概述了开放挑战和未来的研究方向。我们维护了一个开放的存储库,网址为 https://github.com/bowen-upenn/Agent_Rationality。