LLM2D
基于 crowdsourcing 的知识图谱构建用于药物副作用,以 Semaglutide 为例应用大型语言模型
Crowdsourcing-Based Knowledge Graph Construction for Drug Side Effects Using Large Language Models with an Application on Semaglutide
作者: Zhijie Duan, Kai Wei, Zhaoqian Xue, Lingyao li, Jin Jin, Shu Yang, Jiayan Zhou, Siyuan Ma
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2504.04346v1

摘要

arXiv:2504.04346v1 宣布类型: 新 摘要: 社交媒体是获取药物警戒所需的真实世界数据的一个丰富来源,这些数据捕捉了宝贵的患者体验信息。然而,从结构松散且杂乱的社交媒体内容中挖掘数据仍是一项具有挑战性的任务。我们提出了一种系统框架,利用大型语言模型(LLMs)从社交媒体中提取药物副作用,并将其组织成知识图谱(KG)。我们利用来自Reddit的数据显示格列利泰(semaglutide)用于减肥的应用。通过构建的知识图谱,我们进行了全面分析,以调查不同时间点的各种semaglutide品牌报告的副作用。我们通过与FAERS数据库中报告的不良事件进行比较,进一步验证了这些发现,为semaglutide的副作用提供了重要的患者中心洞察,这些洞察补充了semaglutide的安全概况及其对医疗保健专业人员和患者现有的知识库。我们的工作证明了使用LLMs将社交媒体数据转化为结构化KGs进行药物警戒的可行性。