LLM2D

摘要

arXiv:2504.12422v1 声明类型：横跨多个领域摘要：像网络操作这样的高风险领域需要负责任和可信赖的AI方法。虽然大型语言模型（LLMs）在这些领域中的应用越来越受欢迎，但它们仍然存在虚构现象。这篇研究论文从一个关于LinkQ的案例研究中提供了学习成果，LinkQ是一个开源的自然语言接口，旨在通过迫使LLM在回答问题（QA）时查询知识图谱（KG）以获取真实数据来对抗虚构现象。我们使用一个著名的KGQA数据集对LinkQ进行了定量评估，结果显示该系统优于GPT-4，但在某些问题类别上仍然存在困难，这表明未来需要研究其他查询构建策略以在LLM查询系统中更好地应对。我们使用一个真实的网络安全KG与两位领域专家对LinkQ进行了定性研究，阐述了这些专家的反馈、建议、感知到的局限性以及系统如LinkQ的未来机会。