摘要
arXiv:2504.12503v1 宣布类型: cross
摘要:使用机器学习的工程问题通常涉及计算密集型方法,但依赖于有限的数据集。随着新设计和约束条件的出现,工程数据会发生变化,因此模型必须随着时间的推移不断融入新的知识。然而,高昂的计算成本使得从头重新训练模型变得不切实际。连续学习(CL)提供了一个有希望的解决方案,它使模型能够从序列数据中学习,同时缓解灾难性遗忘的问题,即模型会忘记之前学习的映射。本研究通过将几种连续学习方法应用于代表性回归任务,将连续学习引入工程设计。我们将这些策略应用于五个工程数据集,并构建了九个新的工程连续学习基准,以评估它们缓解遗忘和提高泛化的能力。初步结果显示,将现有的连续学习方法应用于这些任务可以改善性能,超过朴素基线。特别是,重放策略在某些基准中实现了与从头重新训练相当的性能,同时将训练时间减少了近一半,这表明其在实际工程工作流中的潜力。本研究中使用的代码和数据集可以在以下链接获取:https://github.com/kmsamuel/cl-for-engineering-release。