摘要
arXiv:2409.14191v3 宣告类型: 修改
摘要:理解人类任务解决轨迹中的偏差对于改进旨在模仿人类推理的AI模型至关重要。本研究将这些偏差分为三种类型:**(1) 表达意图的功能不足**,**(2) 低效的动作序列**,以及**(3) 无法解决问题的错误意图**。为了应对这些问题,我们首先对这三种类型的偏差进行了形式化和定义。然后,我们提出了一种启发式算法来检测O2ARC轨迹中的这些偏差,并对其影响进行了分层和定量分析。此外,我们引入了一种意图估计算法,该算法利用我们形式化的框架来预测用户动作与推断意图之间的缺失对齐信息。通过轨迹对齐,我们实验性地证明,基于人类任务解决轨迹训练的AI模型在模仿人类推理方面表现更好。基于分层分析和实验,我们强调了轨迹-意图对齐的重要性,并展示了意图学习的潜力。