LLM2D

摘要

arXiv:2502.11102v1 宣告类型：新摘要：尽管大规模语言模型（LLMs）取得了快速的发展，但仍然存在一个根本性的挑战：高质量的优化模型数据集的缺乏阻碍了LLMs对自然语言描述（NL）的实际优化问题的稳健建模。这一数据稀缺性也加重了基于学习方法在泛化方面遇到的困难。为了解决这些问题，我们提出了一种可扩展的框架，名为OptMATH，用于合成高质量的数据集。该框架从经过精心筛选的数据种子（带有数学公式MF）开始，自动生成具有可控复杂度的问题数据（PD）。然后采用反向翻译步骤来获得NL。为了验证NL与PD之间的对应关系，使用正向建模步骤和拒绝采样的方法。被接受的配对构成了OptMATH的训练部分。然后确定并进一步过滤掉一组被拒绝的配对。这一集合作为优化模型的新基准，包含实例长度远超NL4OPT和MAMO的复杂案例。通过广泛的实验，我们证明了在OptMATH上训练的各种规模（0.5B-32B参数）的模型在多个建模基准上取得了优异的结果，从而验证了我们方法的有效性和可扩展性。