LLM2D

摘要

arXiv:2409.11232v2 公告类型: 替换-交叉摘要: 在本手稿中，我分析了OpenAI O1-preview模型在解决随机K-SAT实例（K$\in {2,3,4}$）时的性能，其中$\alpha=M/N$，$M$是子句的数量，$N$是可满足问题的变量数量。我展示了该模型可以调用外部SAT求解器来解决这些实例，而不是直接求解。尽管使用了外部求解器，模型仍将错误的赋值作为输出。此外，我提出并展示了一种分析方法，以量化OpenAI O1-preview模型在输出布尔可满足性问题的赋值时，是否表现出智能的火花，还是仅仅进行随机猜测。