摘要
arXiv:2504.09060v1 类型: cross
摘要:深度学习技术在计算生物学中的3D基因组各种分析任务中取得了显著进展。然而,对3D基因组知识的整体理解仍然未被充分探索。在这里,我们提出MIX-HIC,这是第一个将3D基因组结构与表观基因组轨迹相结合的多模态基础模型,能够获得统一且全面的语义。为了实现精确的异质语义融合,我们设计了跨模态交互和映射块,以获得稳健的统一表示,从而实现3D基因组知识的准确聚合。此外,我们引入了第一个包含超过一百万对Hi-C接触图和表观基因组轨迹的大规模数据集,用于高质量的预训练,从而使3D基因组的功能含义探索成为可能。广泛的实验表明,MIX-HIC在各种下游任务中可以显著超越现有最先进的方法。这项工作为推进3D基因组研究提供了有价值的数据资源。