摘要
arXiv:2504.03733v1 交叉类型: cross
摘要:表观遗传学涵盖了不改变基础遗传序列的情况下可以改变基因表达的机制。表观遗传调控基因表达是由DNA甲基化、组蛋白修饰、染色质构型以及非编码RNA等多种机制启动和维持的。基因调控和表达的变化可以表现为各种疾病和异常,如癌症和先天性畸形。在过去的几十年里,高通量实验方法被用于识别和理解表观遗传变化,但这些实验室实验方法和生化过程耗时且昂贵。为了克服这些挑战,机器学习和人工智能(AI)方法已被广泛用于将表观遗传修饰与其表型表现进行映射。在本文中,我们对基于表观基因组数据训练的AI模型进行了一篇综述,以解决包括疾病标志物预测、基因表达、增强子启动子相互作用以及染色质状态等各种问题。本文的目的双管齐下:一是面向AI专家,二是面向表观遗传学家。对于AI研究人员,我们提供了一个表观遗传研究问题的分类,这些问题是可以从基于AI的方法中获益的。对于表观遗传学家,对于上述每一个问题,我们提供了文献中提出的一些候选AI解决方案。我们还指出了文献中存在的若干空白、研究挑战以及应对这些挑战的建议。