摘要
arXiv:2505.08492v1 宣布类型: 新
摘要: 基于PDDL的符号任务规划在机器人自主方面仍然至关重要,但由于可扩展性、重新规划的需求以及计划可用性延迟的问题,它在动态人机协作中遇到了困难。尽管以前有一些神经符号框架已经利用了GPT-3等LLM来应对这些挑战,但依赖于远程闭源模型带来的限制包括:第三方依赖性、响应时间不一致、计划长度和复杂性的限制,以及多领域可扩展性问题。我们提出了Gideon,这是一种新颖的框架,它使过渡到现代、更小的本地LLM成为可能,这些模型具有扩展的上下文长度。Gideon集成了一个新颖的问题生成器,以系统地为任何领域生成大型实际领域-问题-计划三元组数据集,并且它能够对本地LLM进行神经符号规划的调整,使得设备上执行和为多领域支持提供扩展的上下文成为可能。在单领域场景下,使用Qwen-2.5 1.5B进行初步实验并在8k-32k样本上训练,展示了66.1%(32k模型)的有效计划百分比,并表明通过增加数据,这个比例可以进一步扩展。在16k样本上的多领域测试中,有效计划验证率达到了70.6%,证明了其在各领域扩展能力,并表明数据多样性对学习效率具有积极影响。尽管长期规划和缩小模型尺寸使得Gideon的训练效率远低于基于大型LLM的基线模型,但由于训练后的模型大小约为基线模型的120倍小,因此在推断效率、可扩展性和多领域适应性上仍能取得重大优势,这些都是人机协作中的关键因素。通过Gideon简洁的数据生成管道,可以缓解训练效率问题。