LLM2D

摘要

arXiv:2502.05442v2 通知类型: 替换摘要：随着人工智能模型的权力和通用性不断增强，理解智能代理在复杂环境中如何学习和做决策变得至关重要，这对于促进伦理行为至关重要。这项研究引入了《Odyssey》，一种轻量级、可适应的基于文本的冒险游戏，提供了一个可扩展的框架来探索人工智能伦理和安全性。《Odyssey》检查将生物驱动力，特别是自我保护，植入三个不同智能体中的伦理影响。这些智能体经过NEAT优化的贝叶斯智能体、经过随机变分推断优化的贝叶斯智能体以及GPT-4o智能体。智能体在每个场景中选择行动以求生存，并适应越来越具有挑战性的场景。模拟后分析评估了智能体决策的伦理得分，揭示了它们为生存所做出的伦理权衡。具体分析发现，当危险增加时，智能体的伦理行为变得难以预测。令人惊讶的是，GPT-4o智能体在生存和伦理一致性方面都优于贝叶斯模型，这挑战了传统概率方法的假设，并提出了理解大规模语言模型概率推理机制的新挑战。