LLM2D

摘要

大型语言模型 (LLM) 在复杂问答 (QA) 场景中的性能提升一直是研究的重点。最近的研究尝试通过将分步规划与外部检索相结合来增强LLM的性能。虽然这种方法对GPT-3.5等高级模型有效，但较小的LLM在分解复杂问题方面面临挑战，需要进行监督式微调。以前的工作依赖于人工标注和来自教师LLM的知识蒸馏，这既费时又不够准确。在本文中，我们提出了一种新颖的框架，通过使用来自知识图谱 (KG) 的规划数据来增强LLM的规划能力。使用此数据微调的LLM具有改进的规划能力，使其能够更好地处理涉及检索的复杂QA任务。在多个数据集（包括我们新提出的基准）上的评估结果突出了我们框架的有效性和KG衍生规划数据的优势。