LLM2D

摘要

arXiv:2503.23631v1 探索类型: 新摘要: 什么驱使探索？了解内在动机是认知科学和人工智能领域长期面临的挑战；提出了众多目标用于训练代理，但人和代理的探索之间依然存在差距。我们直接在复杂的开放式环境 Crafter 中比较成人、儿童和AI代理，并研究通用内在目标：熵、信息增益和授权，如何与他们的行为相关。我们发现，只有熵和授权与人类探索进展的一致正相关，表明这些目标可能更好地指导代理的内在奖励设计。此外，在代理和人类中我们观察到，熵最初迅速增加，然后停滞，而授权持续增加，这表明状态多样性可能在早期探索中提供更多的信号，而高级探索应优先考虑控制。最后，我们发现初步证据表明，私人性的言语表达，特别是目标言语化，可能有助于儿童的探索。