LLM2D
最适者的.odyssey:智能体能生存下来仍然保持良好性能吗?
The Odyssey of the Fittest: Can Agents Survive and Still Be Good?
作者: Dylan Waldner, Risto Miikkulainen
发布日期: 5/14/2025
arXiv ID: oai:arXiv.org:2502.05442v2

摘要

arXiv:2502.05442v2 通知类型: 替换 摘要:随着人工智能模型的权力和通用性不断增强,理解智能代理在复杂环境中如何学习和做决策变得至关重要,这对于促进伦理行为至关重要。这项研究引入了《Odyssey》,一种轻量级、可适应的基于文本的冒险游戏,提供了一个可扩展的框架来探索人工智能伦理和安全性。《Odyssey》检查将生物驱动力,特别是自我保护,植入三个不同智能体中的伦理影响。这些智能体经过NEAT优化的贝叶斯智能体、经过随机变分推断优化的贝叶斯智能体以及GPT-4o智能体。智能体在每个场景中选择行动以求生存,并适应越来越具有挑战性的场景。模拟后分析评估了智能体决策的伦理得分,揭示了它们为生存所做出的伦理权衡。具体分析发现,当危险增加时,智能体的伦理行为变得难以预测。令人惊讶的是,GPT-4o智能体在生存和伦理一致性方面都优于贝叶斯模型,这挑战了传统概率方法的假设,并提出了理解大规模语言模型概率推理机制的新挑战。