LLM2D

摘要

arXiv:2501.00135v3 宣布类型: replace-cross 摘要：量子计算是一种激动人心的非冯·诺依曼范式，对于特定问题提供了可证明的经典计算加速。然而，当前噪声量子设备下量子电路的经典模拟实用极限仍然不清楚。在这项工作中，我们探讨了利用大型语言模型（LLMs）模拟格罗夫量子图灵机输出的潜力，这是已知可为经典对应物提供二次加速的量子线路。为此，我们开发了GroverGPT，这是一种基于LLaMA的80亿参数架构的专业模型，训练集包含超过15万亿个标记。与需求大量计算资源的全面状态向量模拟不同，GroverGPT通过模式识别来近似量子搜索算法，而无需显式表示量子态。通过对97,000个量子搜索实例的分析，GroverGPT在OpenAI的GPT-4o（45%的准确性）上表现优越，当训练数据集为4个量子比特或更大时，在6个和10个量子比特数据集上达到了近100%的准确性。此外，GroverGPT还展示了强大的泛化能力，在训练数据集为3到6个量子比特的情况下，对超过20个量子比特的系统实现超过95%的准确性。分析表明，GroverGPT捕获了格罗夫搜索的量子特征，而不是经典模式，这得到了新的提示策略以提高性能的支持。尽管随着系统规模的增加准确性下降，这些发现为经典模拟的实用界限提供了见解。这项工作表明，针对特定任务的LLMs可以超越通用模型如GPT-4o在量子算法学习方面的表现，并且可以作为推动量子研究的强大工具。