LLM2D
塑性作为赋能的镜子
Plasticity as the Mirror of Empowerment
作者: David Abel, Michael Bowling, Andr\'e Barreto, Will Dabney, Shi Dong, Steven Hansen, Anna Harutyunyan, Khimya Khetarpal, Clare Lyle, Razvan Pascanu, Georgios Piliouras, Doina Precup, Jonathan Richens, Mark Rowland, Tom Schaul, Satinder Singh
发布日期: 5/16/2025
arXiv ID: oai:arXiv.org:2505.10361v1

摘要

arXiv:2505.10361v1 宣告类型: 新 摘要: 代理是受其过去观察影响并能够影响未来观察的最小实体。这种能力的表现形式是效能,它在人工智能和认知科学中起到了至关重要的作用。然而,代理受其观察影响的方式与程度也同样基础。代理能够在多大程度上被其观察所影响?在这篇文章中,我们基于一个普遍的以代理为中心的度量来定义这个概念,并称之为可塑性,揭示了它与效能的基本联系。遵循一个合适定义所需的一系列目标,我们使用一种新的信息论量度——广义定向信息来定义可塑性。我们展示了这种新的量度严格地扩展了Massey(1990年)引入的定向信息,同时保留了其所有理想的属性。我们第一个发现是:可塑性是效能的镜像:代理的可塑性与其所处环境的效能完全相同,反之亦然。我们第二个发现表明了代理的可塑性与效能之间存在紧张关系,这表明在进行代理设计时需要同时考虑这两种特性。我们探讨了这些发现的影响,并提议可塑性、效能及其关系对于理解代理至关重要。