摘要
arXiv:2403.02514v2 公告类型: replace-cross
摘要:前所未有的人工智能进步推动了越来越自主的机器人的发展。这些机器人在脱离人工工程化工厂环境,进入由人类居住的非结构化环境中操作方面具有巨大的潜力。然而,这种可能性也引发了一个相关的问题——确保机器人的自主学习过程仍然专注于获取有助于实现人类实际目的的知识,同时其行为仍然与其更广泛的目的保持一致。目前,文献仅开始解决这一问题,而一个概念性、术语性和形式化的框架仍然缺乏。在这里,我们解决了一个最具挑战性的实例问题:自主开放式学习(OEL)机器人,这些机器人能够通过直接与环境互动,根据自我生成的目标和内在动机逐步获取新技能和知识。特别地,我们提出了一种计算框架,首先定性引入,然后形式化,以支持平衡自主性和控制性的OEL机器人架构的设计。该框架的核心在于新型的概念——目的。人类目的具体说明了人类(例如,设计师或用户)希望机器人在特定的自主边界内做什么、做什么或不做什么,并与其操作领域无关。该框架将自主性对齐问题分解为更易于处理的子问题:机器人的目的与人类目的的对齐,可能是通过硬编码或通过学习实现;权衡多种目的;将目的具体化为特定领域依赖的机器人目标;以及实现这些目标所需的技能获取。通过讨论在框架内设定的假想示例场景,进一步阐明了框架及其潜在的实用性。