摘要
arXiv:2502.02573v1 公告类型:交叉
摘要:大型语言模型(LLMs)在多个领域展现了令人印象深刻的能力,为革新优化问题求解这一关键、普遍且复杂的领域提供了机会。本文探索了LLMs在处理顺序优化问题(SOPs)方面的能力。我们引入了WorldGen,这是一种生成不可见SOPs的动态框架,并具有可控制的复杂性,以评估LLMs的性能。我们的初步观察表明,虽然LLMs在简单的SOPs上表现良好,但随着复杂性的增加,它们的性能显着下降。受到这一发现的启发,我们回顾了关于推理的哲学假设以增强LLMs的性能。受到黑格尔辩证法框架的启发,我们提出了ACE,并展示了如何在无需重新训练或进一步微调的情况下,显著改善LLMs在SOP上下文中的性能。