摘要
arXiv:2505.01485v1 宣布类型: 新增
摘要: 线性规划(LP)问题旨在在满足约束条件的情况下找到目标的最佳解决方案。这些问题通常需要领域知识、数学技能和编程能力,为非专家带来了巨大的挑战。本研究探讨了大型语言模型(LLMs)在生成求解器特定的LP代码方面的效率。我们提出了CHORUS,这是一种检索增强生成(RAG)框架,用于从自然语言问题描述中合成基于Gurobi的LP代码。CHORUS结合了一种分层的树状片段化策略来处理理论内容,并基于文档中的代码示例生成额外的元数据,以实现自我包含且语义一致的检索。CHORUS的两阶段检索方法与交叉编码器重新排序进一步确保了上下文相关性。最后,精心设计的提示和结构化解析器加上推理步骤显著提高了代码生成性能。在NL4Opt-Code基准上的实验表明,与基线和传统的RAG相比,CHORUS在开源LLMs如Llama3.1(8B)、Llama3.3(70B)、Phi4(14B)、Deepseek-r1(32B)和Qwen2.5-coder(32B)中显著提高了性能。同时,这些开源LLMs在消耗较少计算资源的情况下能够超越或匹配更强大的基线GPT3.5和GPT4的性能。进一步的消融研究表明,专家提示、分层片段化和结构化推理的重要性。