摘要
arXiv:2502.13412v1 交叉类型:cross
摘要:API 知识图谱(API KG)是一个结构化的网络,用于建模 API 实体及其关系,为其推荐 API、代码生成和 API 使用不当检测等任务提供重要的语义洞察。然而,构建一个知识丰富且可靠的 API KG 面临着诸多挑战。现有的基于模式的方法高度依赖于手动注释来设计知识图谱(KG)模式,导致人工干预过多。另一方面,缺乏模式指引的无模式方法容易引入噪声,降低 KG 的可靠性。为了解决这些问题,我们提出了一种基于大规模语言模型(LLMs)的自动化的 API KG 构建框架——Explore-Construct-Filter 框架。该框架包括三个关键模块:1) KG 探索:大规模语言模型模拟注释人员的工作流程,自动设计一个包含全面类型三元组的模式,最大限度地减少人工干预;2) KG 构建:在模式的指导下,大规模语言模型提取实例三元组以构建一个丰富但不可靠的 API KG;3) KG 过滤:去除无效类型三元组和可疑实例三元组,构建一个丰富且可靠的 API KG。实验结果表明,我们的方法超越了最先进的方法,在 F1 分数上提高了 25.2%。此外,Explore-Construct-Filter 框架的有效性也得到了验证,KG 探索模块将 KG 的丰富性提高了 133.6%,而 KG 过滤模块提高了 26.6% 的可靠性。最后,跨模型实验进一步证实了我们框架的泛化能力。