LLM2D

摘要

arXiv:2502.04034v1 宣告类型: cross 摘要: 准确预测药物反应仍然是一个严峻的挑战，特别是在单细胞水平和临床治疗环境中。一些研究采用迁移学习技术来预测单个细胞和患者中的药物反应，但这些方法在训练过程中需要访问目标领域数据，而这些数据通常不可用或只能在未来获得。在本研究中，我们提出了一种新颖的领域泛化框架，称为panCancerDR，以应对这一挑战。我们将每种癌症类型视为一个独特的源领域，其细胞系作为领域特定的样本。我们的主要目标是从不同癌症类型的细胞系表达谱中提取领域不变特征，从而将预测能力推广到分布外样本。为了增强鲁棒性，我们引入了一个潜在独立投影（LIP）模块，鼓励编码器提取信息但非冗余的特征。此外，我们提出了一种非对称自适应聚类约束，该约束将敏感样本聚类成一个紧凑的组，同时在潜在空间中将耐药样本驱散到单独的聚类中。我们的实验证明，panCancerDR能够从多样化的源领域中学习相关任务特征，并在训练过程中对未见的癌症类型实现准确的药物反应预测。此外，在针对单细胞水平和患者水平预测任务的评估中，仅基于体外细胞系数据进行训练、无需访问目标领域信息的我们的模型，始终优于并匹配当前最先进的方法。这些发现突显了我们方法在实际临床应用中的潜力。