LLM2D

摘要

arXiv:2502.13412v1 交叉类型：cross 摘要：API 知识图谱（API KG）是一个结构化的网络，用于建模 API 实体及其关系，为其推荐 API、代码生成和 API 使用不当检测等任务提供重要的语义洞察。然而，构建一个知识丰富且可靠的 API KG 面临着诸多挑战。现有的基于模式的方法高度依赖于手动注释来设计知识图谱（KG）模式，导致人工干预过多。另一方面，缺乏模式指引的无模式方法容易引入噪声，降低 KG 的可靠性。为了解决这些问题，我们提出了一种基于大规模语言模型（LLMs）的自动化的 API KG 构建框架——Explore-Construct-Filter 框架。该框架包括三个关键模块：1) KG 探索：大规模语言模型模拟注释人员的工作流程，自动设计一个包含全面类型三元组的模式，最大限度地减少人工干预；2) KG 构建：在模式的指导下，大规模语言模型提取实例三元组以构建一个丰富但不可靠的 API KG；3) KG 过滤：去除无效类型三元组和可疑实例三元组，构建一个丰富且可靠的 API KG。实验结果表明，我们的方法超越了最先进的方法，在 F1 分数上提高了 25.2%。此外，Explore-Construct-Filter 框架的有效性也得到了验证，KG 探索模块将 KG 的丰富性提高了 133.6%，而 KG 过滤模块提高了 26.6% 的可靠性。最后，跨模型实验进一步证实了我们框架的泛化能力。