LLM2D
scGSDR:利用基因语义进行单细胞药物谱型分析
scGSDR: Harnessing Gene Semantics for Single-Cell Pharmacological Profiling
作者: Yu-An Huang, Xiyue Cao, Zhu-Hong You, Yue-Chao Li, Xuequn Shang, Zhi-An Huang
发布日期: 2/5/2025
arXiv ID: 2502.01689

摘要

arXiv:2502.01689v1 交叉声明类型: 摘要:单细胞测序技术的发展革命性地改变了药物耐药性的探索,揭示了细胞异质性在推进精准医疗中的关键作用。通过从现有的单细胞药物反应数据中构建计算模型,我们可以在后续试验中快速注释细胞对药物的反应。为此,我们开发了 scGSDR 模型,该模型结合了两种基于细胞状态和基因信号通路知识的计算管道,这两种知识对于理解生物基因语义至关重要。scGSDR 通过整合基因语义来增强预测性能,并采用可解释性模块来识别对药物耐药性表型有重大贡献的关键通路。我们进行了广泛的验证,包括16次实验覆盖11种药物,结果显示,当使用bulk-seq或scRNA-seq数据进行训练时,scGSDR 在AUROC、AUPR 和 F1 分数方面的预测准确性均优于其他模型。该模型的应用已从单药预测扩展到涉及药物组合的场景。通过利用已知药物靶基因的通路,我们发现 scGSDR 的细胞-通路注意力评分具有生物学可解释性,这帮助我们识别其他潜在的与药物相关的基因。我们预测中排名靠前的基因,如对于PLX4720的BCL2、CCND1、AKT家族和PIK3CA;以及对于紫杉醇的ICAM1、VCAM1、NFKB1、NFKBIA和RAC1的文献回顾证实了其相关性。总之,通过整合基因语义,scGSDR 提高了对多种药物细胞反应的预测建模能力,在涉及单药和联合疗法的场景中均具有不可替代的价值,并有效地识别了关键耐药相关的通路,从而推动了精准医疗和靶向疗法的发展。