摘要
arXiv:2502.02573v1 交叉公告类型
摘要:大型语言模型(LLMs)在众多领域展现了令人印象深刻的能力,为革新优化问题解决提供了机会,这是关键的、通用的和复杂的领域之一。本文探讨了LLMs处理顺序优化问题(SOPs)的能力。我们引入了WorldGen,这是一种动态框架,用于生成可控复杂性的未见过的SOPs,以评估LLMs的性能。初步观察结果显示,虽然LLMs在简单的SOPs上表现良好,但其性能随着复杂性的增加显著下降。受此启发,我们重新审视了关于推理的哲学假设,以提高LLMs的性能。受到黑格尔辩证法框架的影响,我们提出了ACE,展示了在无需任何重新训练或进一步微调的情况下,如何显著提高LLMs在SOP上下文中的性能。