LLM2D
基于单细胞课程学习的深度图嵌入聚类
Single-cell Curriculum Learning-based Deep Graph Embedding Clustering
作者: Huifa Li, Jie Fu, Xinpeng Ling, Zhiyu Sun, Kuncan Wang, Zhili Chen
发布日期: 11/27/2024
arXiv ID: oai:arXiv.org:2408.10511v2

摘要

单细胞RNA测序(scRNA-seq)技术的快速发展使得研究细胞水平的组织异质性成为可能。细胞注释显著促进了scRNA-seq数据的广泛下游分析。然而,由于scRNA-seq数据的复杂性和不确定性分布(特征是数据量大且缺失事件频率高),其生物学推断分析面临挑战。此外,训练样本的质量差异很大,流行的scRNA-seq数据聚类解决方案GNN的性能可能会受到两种低质量训练节点的影响:1)边界上的节点;2)对图几乎没有额外信息贡献的节点。为了解决这些问题,我们提出了一种基于单细胞课程学习的深度图嵌入聚类方法(scCLG)。我们首先提出了一种具有多解码器的切比雪夫图卷积自编码器(ChebAE),它结合了对应于三个解码器的三个优化目标,包括细胞图的拓扑重建损失、零膨胀负二项式(ZINB)损失和聚类损失,以学习细胞-细胞拓扑表示。同时,我们采用选择性训练策略,基于节点的特征和熵来训练GNN,并根据难度得分修剪困难节点以保留高质量图。在各种基因表达数据集上的实证结果表明,我们的模型优于现有最先进的方法。