摘要
传统的机器人模拟器专注于物理过程建模和逼真的渲染,往往面临着高计算成本、低效和适应性差等问题。为了解决这个问题,我们提出了机器人行为模拟,强调检查机器人的行为逻辑,并在机器人动作的结果和真实场景之间实现充分的一致性。本文介绍了 BeSimulator,一个模块化且新颖的基于大型语言模型 (LLM) 的框架,作为在文本环境中进行行为模拟的尝试。通过构建基于文本的虚拟环境并进行语义级模拟,BeSimulator 可以跨场景泛化并实现长期的复杂模拟。受人类认知过程的启发,它采用了一种名为行为模拟链的“考虑-决定-捕获-转移”方法,擅长分析动作的可行性和状态转换。此外,BeSimulator 还整合了代码驱动的推理,以实现算术运算并增强可靠性,并集成了反射反馈以改进模拟。基于我们手动构建的基于行为树的模拟基准 BTSIMBENCH,我们的实验表明,与基线相比,行为模拟的性能有了显著提高,范围从 14.7% 到 26.6%。