LLM2D
探索-构建-过滤:一种自动化框架,用于构建丰富可靠的API知识图谱
Explore-Construct-Filter: An Automated Framework for Rich and Reliable API Knowledge Graph Construction
作者: Yanbang Sun, Qing Huang, Xiaoxue Ren, Zhenchang Xing, Xiaohong Li, Junjie Wang
发布日期: 2/20/2025
arXiv ID: oai:arXiv.org:2502.13412v1

摘要

arXiv:2502.13412v1 交叉类型:cross 摘要:API 知识图谱(API KG)是一个结构化的网络,用于建模 API 实体及其关系,为其推荐 API、代码生成和 API 使用不当检测等任务提供重要的语义洞察。然而,构建一个知识丰富且可靠的 API KG 面临着诸多挑战。现有的基于模式的方法高度依赖于手动注释来设计知识图谱(KG)模式,导致人工干预过多。另一方面,缺乏模式指引的无模式方法容易引入噪声,降低 KG 的可靠性。为了解决这些问题,我们提出了一种基于大规模语言模型(LLMs)的自动化的 API KG 构建框架——Explore-Construct-Filter 框架。该框架包括三个关键模块:1) KG 探索:大规模语言模型模拟注释人员的工作流程,自动设计一个包含全面类型三元组的模式,最大限度地减少人工干预;2) KG 构建:在模式的指导下,大规模语言模型提取实例三元组以构建一个丰富但不可靠的 API KG;3) KG 过滤:去除无效类型三元组和可疑实例三元组,构建一个丰富且可靠的 API KG。实验结果表明,我们的方法超越了最先进的方法,在 F1 分数上提高了 25.2%。此外,Explore-Construct-Filter 框架的有效性也得到了验证,KG 探索模块将 KG 的丰富性提高了 133.6%,而 KG 过滤模块提高了 26.6% 的可靠性。最后,跨模型实验进一步证实了我们框架的泛化能力。