LLM2D
GroverGPT:一个用于量子搜索的80亿参数大型语言模型
GroverGPT: A Large Language Model with 8 Billion Parameters for Quantum Searching
作者: Haoran Wang, Pingzhi Li, Min Chen, Jinglei Cheng, Junyu Liu, Tianlong Chen
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2501.00135v3

摘要

arXiv:2501.00135v3 宣布类型: replace-cross 摘要:量子计算是一种激动人心的非冯·诺依曼范式,对于特定问题提供了可证明的经典计算加速。然而,当前噪声量子设备下量子电路的经典模拟实用极限仍然不清楚。在这项工作中,我们探讨了利用大型语言模型(LLMs)模拟格罗夫量子图灵机输出的潜力,这是已知可为经典对应物提供二次加速的量子线路。为此,我们开发了GroverGPT,这是一种基于LLaMA的80亿参数架构的专业模型,训练集包含超过15万亿个标记。与需求大量计算资源的全面状态向量模拟不同,GroverGPT通过模式识别来近似量子搜索算法,而无需显式表示量子态。通过对97,000个量子搜索实例的分析,GroverGPT在OpenAI的GPT-4o(45%的准确性)上表现优越,当训练数据集为4个量子比特或更大时,在6个和10个量子比特数据集上达到了近100%的准确性。此外,GroverGPT还展示了强大的泛化能力,在训练数据集为3到6个量子比特的情况下,对超过20个量子比特的系统实现超过95%的准确性。分析表明,GroverGPT捕获了格罗夫搜索的量子特征,而不是经典模式,这得到了新的提示策略以提高性能的支持。尽管随着系统规模的增加准确性下降,这些发现为经典模拟的实用界限提供了见解。这项工作表明,针对特定任务的LLMs可以超越通用模型如GPT-4o在量子算法学习方面的表现,并且可以作为推动量子研究的强大工具。