LLM2D
内在动机的人类和代理在开放世界探索中
Intrinsically-Motivated Humans and Agents in Open-World Exploration
作者: Aly Lidayan, Yuqing Du, Eliza Kosoy, Maria Rufova, Pieter Abbeel, Alison Gopnik
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.23631v1

摘要

arXiv:2503.23631v1 探索类型: 新 摘要: 什么驱使探索?了解内在动机是认知科学和人工智能领域长期面临的挑战;提出了众多目标用于训练代理,但人和代理的探索之间依然存在差距。我们直接在复杂的开放式环境 Crafter 中比较成人、儿童和AI代理,并研究通用内在目标:熵、信息增益和授权,如何与他们的行为相关。我们发现,只有熵和授权与人类探索进展的一致正相关,表明这些目标可能更好地指导代理的内在奖励设计。此外,在代理和人类中我们观察到,熵最初迅速增加,然后停滞,而授权持续增加,这表明状态多样性可能在早期探索中提供更多的信号,而高级探索应优先考虑控制。最后,我们发现初步证据表明,私人性的言语表达,特别是目标言语化,可能有助于儿童的探索。