LLM2D

摘要

arXiv:2502.02573v1 交叉公告类型摘要：大型语言模型（LLMs）在众多领域展现了令人印象深刻的能力，为革新优化问题解决提供了机会，这是关键的、通用的和复杂的领域之一。本文探讨了LLMs处理顺序优化问题（SOPs）的能力。我们引入了WorldGen，这是一种动态框架，用于生成可控复杂性的未见过的SOPs，以评估LLMs的性能。初步观察结果显示，虽然LLMs在简单的SOPs上表现良好，但其性能随着复杂性的增加显著下降。受此启发，我们重新审视了关于推理的哲学假设，以提高LLMs的性能。受到黑格尔辩证法框架的影响，我们提出了ACE，展示了在无需任何重新训练或进一步微调的情况下，如何显著提高LLMs在SOP上下文中的性能。