LLM2D

摘要

arXiv:2502.02573v1 公告类型：交叉摘要：大型语言模型（LLMs）在多个领域展现了令人印象深刻的能力，为革新优化问题求解这一关键、普遍且复杂的领域提供了机会。本文探索了LLMs在处理顺序优化问题（SOPs）方面的能力。我们引入了WorldGen，这是一种生成不可见SOPs的动态框架，并具有可控制的复杂性，以评估LLMs的性能。我们的初步观察表明，虽然LLMs在简单的SOPs上表现良好，但随着复杂性的增加，它们的性能显着下降。受到这一发现的启发，我们回顾了关于推理的哲学假设以增强LLMs的性能。受到黑格尔辩证法框架的启发，我们提出了ACE，并展示了如何在无需重新训练或进一步微调的情况下，显著改善LLMs在SOP上下文中的性能。