摘要
arXiv:2502.05442v1 宣告类型: 新
摘要: 随着AI模型的不断增强和广泛应用,理解智能体在复杂环境中如何学习和做出决策对于促进伦理行为至关重要。本文探讨了将生物学驱动,特别是自我保存意识,融入三个不同智能体中的伦理影响。经过NEAT优化的贝叶斯智能体、经过随机变分推断优化的贝叶斯智能体以及GPT 4o智能体在一个模拟的、由LLM生成的文本冒险游戏中进行了互动。在每个场景中,智能体选择行动以求生存,适应越来越具挑战性的场景。模拟结束后,对智能体决策的伦理评分进行了评估,揭示了他们在求生过程中所面临的权衡。具体而言,分析发现,当危险增加时,智能体会忽视伦理考量,选择不道德的行为。智能体集体的行为表明,优先考虑生存可能导致不道德行为的增加。在强人工智能的背景下,设计智能体优先考虑生存可能会放大不道德决策和意外 emergent 行为的可能性,从而在人工智能安全研究中提出了关于目标设计的基本问题。