LLM2D

摘要

arXiv:2502.03992v1 类型: cross 摘要: 大多数现有的知识图谱问答（KGQA）方法都是针对特定的知识图谱进行设计的，比如Wikidata、DBpedia或Freebase。由于底层图模式、拓扑结构和断言的异质性，大多数KGQA系统在没有资源密集型训练数据的情况下无法转移到未见过的知识图谱（KGs）中。我们提出了OntoSCPrompt，这是一种基于大型语言模型（LLM）的具有两阶段架构的KGQA方法，该架构将语义解析与KG依赖交互分开。OntoSCPrompt首先生成SPARQL查询结构（包括SELECT、ASK、WHERE这样的SPARQL关键词以及缺失token的占位符），然后用特定于KG的信息填充这些占位符。为了增强对底层KG的理解，我们提出了一种基于本体的混合提示学习策略，将KG本体整合到混合提示（例如，离散和连续向量）的学习过程中。我们还提出了几种任务特定的解码策略，以确保两阶段生成的SPARQL查询的正确性和可执行性。实验结果表明，在诸如CWQ、WebQSP和LC-QuAD 1.0等KGQA数据集上，OntoSCPrompt在资源高效的方式下与SOTA方法表现相当，并且能够很好地泛化到未见过的特定领域知识图谱，如DBLP-QuAD和CoyPu KG。代码: \href{https://github.com/LongquanJiang/OntoSCPrompt}{https://github.com/LongquanJiang/OntoSCPrompt}