LLM2D
快速分析OpenAI O1-预览模型在解决随机K-SAT问题中的表现:LLM是自行解决问题还是调用外部SAT求解器?
Fast Analysis of the OpenAI O1-Preview Model in Solving Random K-SAT Problem: Does the LLM Solve the Problem Itself or Call an External SAT Solver?
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.11232v2

摘要

arXiv:2409.11232v2 公告类型: 替换-交叉 摘要: 在本手稿中,我分析了OpenAI O1-preview模型在解决随机K-SAT实例(K$\in {2,3,4}$)时的性能,其中$\alpha=M/N$,$M$是子句的数量,$N$是可满足问题的变量数量。我展示了该模型可以调用外部SAT求解器来解决这些实例,而不是直接求解。尽管使用了外部求解器,模型仍将错误的赋值作为输出。此外,我提出并展示了一种分析方法,以量化OpenAI O1-preview模型在输出布尔可满足性问题的赋值时,是否表现出智能的火花,还是仅仅进行随机猜测。