摘要
arXiv:2502.05442v2 通知类型: 替换
摘要:随着人工智能模型的权力和通用性不断增强,理解智能代理在复杂环境中如何学习和做决策变得至关重要,这对于促进伦理行为至关重要。这项研究引入了《Odyssey》,一种轻量级、可适应的基于文本的冒险游戏,提供了一个可扩展的框架来探索人工智能伦理和安全性。《Odyssey》检查将生物驱动力,特别是自我保护,植入三个不同智能体中的伦理影响。这些智能体经过NEAT优化的贝叶斯智能体、经过随机变分推断优化的贝叶斯智能体以及GPT-4o智能体。智能体在每个场景中选择行动以求生存,并适应越来越具有挑战性的场景。模拟后分析评估了智能体决策的伦理得分,揭示了它们为生存所做出的伦理权衡。具体分析发现,当危险增加时,智能体的伦理行为变得难以预测。令人惊讶的是,GPT-4o智能体在生存和伦理一致性方面都优于贝叶斯模型,这挑战了传统概率方法的假设,并提出了理解大规模语言模型概率推理机制的新挑战。