摘要
生物树分析是揭示生物体、基因和细胞之间进化和分化关系的关键工具,其应用范围涵盖系统发育学、发育生物学、生态学和医学等多个领域。传统的树推断方法虽然在早期研究中奠定了基础,但在处理现代高通量技术产生的海量复杂数据集方面面临着越来越大的局限性。深度学习的最新进展提供了有希望的解决方案,增强了数据处理和模式识别能力。然而,挑战仍然存在,特别是在准确地表示生物树固有的离散和非欧几里得性质方面。在本综述中,我们首先概述了系统发育和分化树分析中至关重要的生物先验,促进深度学习研究人员和生物学家之间更深入的跨学科理解。然后,我们系统地检查了常用的数据格式和数据库,作为模型测试和开发的全面资源。我们对传统的树生成方法进行了批判性分析,探讨了它们的潜在生物学假设、技术特征和局限性。回顾了基于深度学习的树生成的最新发展,重点介绍了最近的进展和现有的挑战。此外,我们讨论了生物树在各个生物学领域的多样化应用。最后,我们提出了利用深度学习进行生物树研究的潜在未来方向和趋势,旨在指导该领域进一步探索和创新。