LLM2D

摘要

arXiv:2504.04346v2 宣告类型: 替代摘要：社交媒体是一个丰富的实时数据来源，其中包含了对药物警戒有价值的病人体验信息。然而，挖掘来自无结构且噪声较大的社交媒体内容的数据仍然是一个具有挑战性的任务。我们提出了一种系统的框架，利用大规模语言模型（LLMs）从社交媒体中提取药物副作用，并将其组织到知识图谱（KG）中。我们使用来自Reddit的数据将这一框架应用于减肥用赛美格鲁肽的副作用提取。通过构建的知识图谱，我们进行了全面的分析，以调查不同赛美格鲁肽品牌在不同时间报告的副作用。这些发现通过与FAERS数据库中报告的不良事件进行比较来进一步验证，提供了关于赛美格鲁肽副作用的重要病人中心化的见解，这些见解补充了赛美格鲁肽的安全性概况以及有关赛美格鲁肽的现有知识库，适用于医疗专业人士和患者。我们的工作展示了如何利用LLMs将社交媒体数据转换为结构化的知识图谱以用于药物警戒的可行性。