LLM2D

摘要

arXiv:2502.02717v1 交叉类型：cross 摘要：基础模型已成为深度学习领域的一种强大范式，借助其从大规模数据集中学习稳健表示的能力，并有效应用于各类下游应用程序，如分类。本文介绍了Astromer 2，这是一种专门用于提取光曲线嵌入的基础模型。我们引入Astromer 2作为我们用于光曲线分析的自我监督模型的增强版本。本文突出了其预训练嵌入的优势，将其性能与其前身Astromer 1进行了比较，并提供了其能力的详细实证分析，提供了模型表示的更深层次洞察。Astromer 2基于MACHO调查中的150万单带光曲线进行预训练，使用一个自我监督学习任务，该任务预测序列中的随机掩蔽观察值。通过对一个较小的标注数据集进行微调，我们可以评估其在分类任务中的性能。嵌入的质量通过在Astromer生成的嵌入上训练的MLP分类器的F1分数来衡量。我们的结果表明，Astromer 2在所有评估场景中均显著优于Astromer 1，包括每类20、100和500个样本的有限数据集。使用集成自Astromer注意力块的中间表示的加权样本嵌入特别具有影响性。值得注意的是，与先前模型相比，Astromer 2在ATLAS数据集上的F1分数提高了15%，展示了其对新数据集的强大泛化能力。这种增强的性能，特别是在少量标注数据的情况下，突显了Astromer 2在更高效的光曲线分析中的潜力。