LLM2D
OptMATH:一个可扩展的双向数据合成框架用于优化建模
OptMATH: A Scalable Bidirectional Data Synthesis Framework for Optimization Modeling
作者: Hongliang Lu, Zhonglin Xie, Yaoyu Wu, Can Ren, Yuxuan Chen, Zaiwen Wen
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11102v1

摘要

arXiv:2502.11102v1 宣告类型:新 摘要:尽管大规模语言模型(LLMs)取得了快速的发展,但仍然存在一个根本性的挑战:高质量的优化模型数据集的缺乏阻碍了LLMs对自然语言描述(NL)的实际优化问题的稳健建模。这一数据稀缺性也加重了基于学习方法在泛化方面遇到的困难。为了解决这些问题,我们提出了一种可扩展的框架,名为OptMATH,用于合成高质量的数据集。该框架从经过精心筛选的数据种子(带有数学公式MF)开始,自动生成具有可控复杂度的问题数据(PD)。然后采用反向翻译步骤来获得NL。为了验证NL与PD之间的对应关系,使用正向建模步骤和拒绝采样的方法。被接受的配对构成了OptMATH的训练部分。然后确定并进一步过滤掉一组被拒绝的配对。这一集合作为优化模型的新基准,包含实例长度远超NL4OPT和MAMO的复杂案例。通过广泛的实验,我们证明了在OptMATH上训练的各种规模(0.5B-32B参数)的模型在多个建模基准上取得了优异的结果,从而验证了我们方法的有效性和可扩展性。