LLM2D

摘要

arXiv:2503.21095v1 Announce Type: cross 摘要：加速发现和制造具有特定性质的先进材料是一个关键但艰巨的挑战，原因在于庞大的搜索空间、实验成本高昂以及材料表征的耗时性。近年来，主动学习作为一种有前景的方法已经出现，它模拟了人类科学家的科学发现过程，通过在有限预算下引导实验以实现高价值成果来应对这些挑战。在众多主动学习的哲学思想中，捕捉预期结果和观察结果之间偏差的惊喜概念已经展示出显著潜力，能够驱动实验试次并改进预测模型。科学发现往往源自于惊喜，因此使其成为自然驱动因素，用于引导搜索过程。尽管如此，以前利用香农和贝叶斯惊喜等度量的研究缺乏机制来考虑先前的置信度，导致过多探索不确定区域，这些区域可能不会提供有用的信息。为了解决这一问题，我们提出了自信校正惊喜度量的主动资源密集型试次（CA-SMART）框架，这是一种针对优化数据驱动实验而设计的新型贝叶斯主动学习框架。从宏观角度来看，CA-SMART结合了自信校正惊喜（CAS）来动态平衡探索和利用，通过在模型更加确定的区域放大惊喜，而在高度不确定的区域降低惊喜。我们在两个基准函数（六鞍骆驼峰和Griewank）上以及在预测钢的疲劳强度方面评估了CA-SMART。结果表明，CA-SMART在准确性与效率方面优于传统的惊喜度量、标准贝叶斯优化（BO）获取函数以及传统机器学习方法。