摘要
arXiv:2503.23631v1 探索类型: 新
摘要: 什么驱使探索?了解内在动机是认知科学和人工智能领域长期面临的挑战;提出了众多目标用于训练代理,但人和代理的探索之间依然存在差距。我们直接在复杂的开放式环境 Crafter 中比较成人、儿童和AI代理,并研究通用内在目标:熵、信息增益和授权,如何与他们的行为相关。我们发现,只有熵和授权与人类探索进展的一致正相关,表明这些目标可能更好地指导代理的内在奖励设计。此外,在代理和人类中我们观察到,熵最初迅速增加,然后停滞,而授权持续增加,这表明状态多样性可能在早期探索中提供更多的信号,而高级探索应优先考虑控制。最后,我们发现初步证据表明,私人性的言语表达,特别是目标言语化,可能有助于儿童的探索。