LLM2D

摘要

arXiv:2502.13166v1 交叉公告类型：cross 摘要：在嘈杂的中等规模量子（NISQ）计算时代，量子神经网络（QNNs）已成为各种应用的有前途的方法，但其训练往往因梯度方差随着模型大小增加而指数级消失的荒谬 plateau (BP) 受阻。为了解决这一挑战，我们提出了一种新的由大语言模型（LLM）驱动的搜索框架 AdaInit，该框架迭代地搜索 QNNs 的最优初始参数以最大化梯度方差，从而减轻 BP。与传统的单次初始化方法不同，AdaInit 使用具有自适应提示的 LLM 动态细化 QNN 的初始化。期望改进（EI）的理论分析证明了搜索的上界，确保该过程最终可以识别出 QNN 的最优初始参数。在四个公开数据集上的广泛实验表明，与经典初始化方法相比，AdaInit 显著提高了 QNN 的可训练性，验证了其在减轻 BP 方面的有效性。