LLM2D

摘要

传统的机器人模拟器专注于物理过程建模和逼真的渲染，往往面临着高计算成本、低效和适应性差等问题。为了解决这个问题，我们提出了机器人行为模拟，强调检查机器人的行为逻辑，并在机器人动作的结果和真实场景之间实现充分的一致性。本文介绍了 BeSimulator，一个模块化且新颖的基于大型语言模型 (LLM) 的框架，作为在文本环境中进行行为模拟的尝试。通过构建基于文本的虚拟环境并进行语义级模拟，BeSimulator 可以跨场景泛化并实现长期的复杂模拟。受人类认知过程的启发，它采用了一种名为行为模拟链的“考虑-决定-捕获-转移”方法，擅长分析动作的可行性和状态转换。此外，BeSimulator 还整合了代码驱动的推理，以实现算术运算并增强可靠性，并集成了反射反馈以改进模拟。基于我们手动构建的基于行为树的模拟基准 BTSIMBENCH，我们的实验表明，与基线相比，行为模拟的性能有了显著提高，范围从 14.7% 到 26.6%。