摘要
arXiv:2410.12480v2 公告类型: replace-cross
摘要:模式匹配(SM)和实体匹配(EM)任务对于数据集成至关重要。尽管大型语言模型(LLMs)在这些任务中表现出令人鼓舞的结果,但它们在任务指令方面存在幻觉和混淆的问题。本研究提出了知识合规匹配框架(KcMF),这是一种基于LLM的方法,解决了这些问题,而无需进行领域特定的微调。KcMF采用一次成型的伪代码为基础的任务分解策略,采用自然语言语句来引导LLM推理并减少各种任务类型的混淆。此外,我们还提出了两种机制——数据集作为知识(DaK)和示例作为知识(EaK),在缺乏结构化领域知识时构建领域知识集。同时,我们引入了一种结果聚合策略,利用多个知识来源并抑制格式不规范的输出。广泛的评估证实,KcMF 明显增强了两种模式匹配任务中五个LLM基础模型的表现,平均F1分比非LLM竞争对手高出17.93%。