摘要
arXiv:2504.20118v1 宣告类型: cross
摘要:传统中医药(TCM)代表了丰富的古代医学知识宝库,至今在现代医疗保健中仍发挥着重要作用。由于TCM文献的复杂性和广泛性,集成AI技术对于其现代化和更广泛的可获取性至关重要。然而,这种集成面临着诸多挑战,包括解释晦涩的古典中文文本以及建模TCM概念之间错综复杂的语义关系。在本文中,我们开发了基于LLM的OpenTCM系统,该系统结合了一个特定领域的TCM知识图谱和基于图的检索增强生成(GraphRAG)。首先,在中医经典文献数据库中,借助TCM和妇科学专家的帮助,我们提取了来自68本妇科书籍的超过373万个古典中文字符。其次,我们构建了一个全面的多关系知识图谱,包含了超过48,000个实体和152,000种相互关系,使用定制的提示和面向中文的LLM(如DeepSeek和Kimi),以确保高保真语义理解。最后,我们将OpenTCM与该知识图谱集成,从而在不进行模型微调的情况下实现高保真成分知识检索和诊断问答。实验评估表明,我们的提示设计和模型选择显著提高了知识图谱的质量,精确度达到98.55%,F1分数达到99.55%。此外,在成分信息检索和诊断问答任务中,OpenTCM分别获得了4.5和3.8的专家平均分数,优于现实世界中医应用场景中的最新解决方案。