LLM2D

摘要

arXiv:2409.07569v3 宣告类型: 替换-交叉摘要：逆约束强化学习（ICRL）是指基于专家代理的演示数据推断其遵守的隐式约束的任务。作为一种新兴的研究主题，ICRL 近年来受到了相当大的关注。本文对 ICRL 最新的进展进行了分类综述，旨在为机器学习研究者、实践者以及初学者提供一个全面的参考，帮助他们理解 ICRL 的定义、进展和重要挑战。首先，本文正式定义了问题，并概述了一个通用的算法框架，该框架使得在各种场景中推断约束成为可能。这些场景包括确定性或随机环境、演示样本有限的环境以及多个代理的环境。对于每个特定的场景，本文阐述了关键挑战，并介绍了一系列基本方法来应对这些挑战。本综述涵盖了用于评估 ICRL 代理的离散、虚拟和现实环境。本文还探讨了 ICRL 最重要的应用，如自动驾驶、机器人控制和体育分析。为了促进持续研究，本文以讨论关键未解决问题结束，这些问题能够有效地架起理论理解与实际工业应用之间的桥梁。本文引用的论文可在 https://github.com/Jasonxu1225/Awesome-Constraint-Inference-in-RL 找到。