LLM2D
从文本到网络:使用生成式AI构建基于台湾的中国研究知识图谱
From Text to Network: Constructing a Knowledge Graph of Taiwan-Based China Studies Using Generative AI
作者: Hsuan-Lei Shao
发布日期: 5/16/2025
arXiv ID: oai:arXiv.org:2505.10093v1

摘要

arXiv:2505.10093v1 通知类型: 新 摘要: 台湾中国研究(CS)已成为一个丰富且跨学科的研究领域,这一领域受到独特的地缘政治地位和长期与中国大陆学术交往的影响。本研究针对近年来系统回顾和重组台湾基点上的CS学术文献的需求不断增强,提出了一种人工智能辅助的方法,将无结构的学术文本转化为结构化且互动的知识表示。我们应用生成型人工智能(GAI)技术和大型语言模型(LLMs),从1996年至2019年间发表的1,367篇经过同行评审的CS文章中提取并标准化实体关系三元组。然后,我们通过基于轻量级D3.js的系统来可视化这些三元组,形成了该学科的专业知识图谱和向量数据库的基础。这一基础设施允许用户探索文集中概念节点和语义关系,揭示之前未被探索的知识轨迹、主题集群和研究缺口。通过将文本内容分解为图结构化知识单元,我们的系统使从线性文本消费转向基于网络的知识导航成为可能。它不仅增强了学术界对中国研究文献的访问,还为传统的本体构建提供了可扩展的数据驱动替代方案。本文不仅展示了生成型人工智能如何增强区域研究和数字人文领域,还指出了其支持重塑的学术基础设施以促进区域知识系统的可能性。