LLM2D

摘要

arXiv:2504.12503v1 宣布类型: cross 摘要：使用机器学习的工程问题通常涉及计算密集型方法，但依赖于有限的数据集。随着新设计和约束条件的出现，工程数据会发生变化，因此模型必须随着时间的推移不断融入新的知识。然而，高昂的计算成本使得从头重新训练模型变得不切实际。连续学习（CL）提供了一个有希望的解决方案，它使模型能够从序列数据中学习，同时缓解灾难性遗忘的问题，即模型会忘记之前学习的映射。本研究通过将几种连续学习方法应用于代表性回归任务，将连续学习引入工程设计。我们将这些策略应用于五个工程数据集，并构建了九个新的工程连续学习基准，以评估它们缓解遗忘和提高泛化的能力。初步结果显示，将现有的连续学习方法应用于这些任务可以改善性能，超过朴素基线。特别是，重放策略在某些基准中实现了与从头重新训练相当的性能，同时将训练时间减少了近一半，这表明其在实际工程工作流中的潜力。本研究中使用的代码和数据集可以在以下链接获取：https://github.com/kmsamuel/cl-for-engineering-release。