LLM2D

摘要

arXiv:2503.08558v2 宣告类型：替换交叉摘要：近年来，随着模仿学习和生成建模的发展，特别是随着扩散模型和流模型方法的进步，见证了一系列令人印象深刻的机器人操作系统。随着机器人策略性能的提高，可实现的任务的复杂性和时间范围也随之增加，这导致了难以预测的多种出错模式。为了在安全关键的人类环境中实现可靠的操作策略部署，决策时的失败检测变得尤为重要。然而，大多数现有的失败检测方法依赖于失败模式的先验知识，并且需要在训练期间使用失败数据，这在实际应用和扩展性方面提出了重大挑战。针对这些局限性，我们提出了FAIL-Detect，这是一种用于基于模仿学习的机器人操作失败检测的模块化两阶段方法。为了仅从成功的训练数据中准确识别失败，我们将问题表述为顺序分布外（OOD）检测问题。我们首先将策略输入和输出压缩为与策略失败相关联的标量信号，并捕捉表征性不确定性。然后，FAIL-Detect 使用可变形预测（CP）作为不确定性的量化框架，以提供统计保证。通过实证研究，我们在多种机器人操作任务中全面调查了已学习的和事后处理的标量信号候选方案。我们的实验表明，已学习的信号通常表现得更为一致有效，尤其是当我们使用我们的新颖流模型密度估计器时。此外，我们的方法比最先进的（SOTA）失败检测基线更准确且更快速地检测失败。这些结果突显了FAIL-Detect 有能力增强基于模仿学习的机器人系统在迈向实际部署过程中的安全性和可靠性。