摘要
arXiv:2502.09897v1 宣告类型: 新
摘要: 机器学习(ML)和人工智能(AI)的迅速发展引发了化学领域的重大变革,然而,将这些方法应用于光谱和光谱分析数据,即光谱机器学习(SpectraML),的应用仍然相对较少。现代光谱技术(包括质谱、核磁共振、红外光谱、拉曼光谱、紫外-可见光谱)生成了不断增长的高维数据量,迫切需要超越传统基于专家的工作流程的自动化和智能化分析。在本综述中,我们提供了一个统一的SpectraML综述,系统地考察了最先进的用于正向任务(分子到光谱预测)和反向任务(光谱到分子推理)的方法。我们追溯了光谱领域中ML的历史演变,从早期的模式识别到最新的能够进行高级推理的基础模型,并提供了一种代表性神经架构的分类,包括基于图的方法和基于变换器的方法。针对数据质量、多模态集成和计算可扩展性等关键挑战,我们强调了合成数据生成、大规模预训练和少样本或零样本学习等新兴方向。为了促进可再现研究,我们还发布了包含近期论文及其相应数据集的开源仓库(https://github.com/MINE-Lab-ND/SpectrumML_Survey_Papers)。我们的综述为研究人员提供了一条路线图,引导其在光谱学与人工智能的交叉领域取得进展。