LLM2D

摘要

癌症具有内在的异质性，通常根据其独特的特征、细胞起源和每种类型特有的分子标记将其分为不同的亚型。然而，目前的研究所依赖的主要是完整的组学多组学数据集来预测癌症亚型，往往忽略了在某些组学数据可能缺失的情况下的预测性能，并且忽略了多层组学数据整合中的隐含关系。本文介绍了一种用于癌症亚型分类的新方法——多层矩阵分解法(MLMF)，该方法采用多组学数据聚类。MLMF首先通过多层线性或非线性分解处理多组学特征矩阵，将原始数据分解成每个组学类型特有的潜在特征表示。随后，这些潜在表示被融合成一种一致的形式，然后进行谱聚类以确定亚型。此外，MLMF还结合了类别指示矩阵来处理缺失的组学数据，创建了一个统一的框架，可以管理完整和不完整的组学多组学数据。在10个完整的和缺失值的组学多组学癌症数据集上进行的大量实验表明，MLMF取得的结果与几种最先进的方法相比，具有可比性甚至超越了它们的性能。