LLM2D

摘要

arXiv:2505.08492v1 宣布类型: 新摘要: 基于PDDL的符号任务规划在机器人自主方面仍然至关重要，但由于可扩展性、重新规划的需求以及计划可用性延迟的问题，它在动态人机协作中遇到了困难。尽管以前有一些神经符号框架已经利用了GPT-3等LLM来应对这些挑战，但依赖于远程闭源模型带来的限制包括：第三方依赖性、响应时间不一致、计划长度和复杂性的限制，以及多领域可扩展性问题。我们提出了Gideon，这是一种新颖的框架，它使过渡到现代、更小的本地LLM成为可能，这些模型具有扩展的上下文长度。Gideon集成了一个新颖的问题生成器，以系统地为任何领域生成大型实际领域-问题-计划三元组数据集，并且它能够对本地LLM进行神经符号规划的调整，使得设备上执行和为多领域支持提供扩展的上下文成为可能。在单领域场景下，使用Qwen-2.5 1.5B进行初步实验并在8k-32k样本上训练，展示了66.1%（32k模型）的有效计划百分比，并表明通过增加数据，这个比例可以进一步扩展。在16k样本上的多领域测试中，有效计划验证率达到了70.6%，证明了其在各领域扩展能力，并表明数据多样性对学习效率具有积极影响。尽管长期规划和缩小模型尺寸使得Gideon的训练效率远低于基于大型LLM的基线模型，但由于训练后的模型大小约为基线模型的120倍小，因此在推断效率、可扩展性和多领域适应性上仍能取得重大优势，这些都是人机协作中的关键因素。通过Gideon简洁的数据生成管道，可以缓解训练效率问题。