摘要
arXiv:2504.12422v1 声明类型:横跨多个领域
摘要:像网络操作这样的高风险领域需要负责任和可信赖的AI方法。虽然大型语言模型(LLMs)在这些领域中的应用越来越受欢迎,但它们仍然存在虚构现象。这篇研究论文从一个关于LinkQ的案例研究中提供了学习成果,LinkQ是一个开源的自然语言接口,旨在通过迫使LLM在回答问题(QA)时查询知识图谱(KG)以获取真实数据来对抗虚构现象。我们使用一个著名的KGQA数据集对LinkQ进行了定量评估,结果显示该系统优于GPT-4,但在某些问题类别上仍然存在困难,这表明未来需要研究其他查询构建策略以在LLM查询系统中更好地应对。我们使用一个真实的网络安全KG与两位领域专家对LinkQ进行了定性研究,阐述了这些专家的反馈、建议、感知到的局限性以及系统如LinkQ的未来机会。