摘要
arXiv:2502.13166v1 交叉公告类型:cross
摘要:在嘈杂的中等规模量子(NISQ)计算时代,量子神经网络(QNNs)已成为各种应用的有前途的方法,但其训练往往因梯度方差随着模型大小增加而指数级消失的荒谬 plateau (BP) 受阻。为了解决这一挑战,我们提出了一种新的由大语言模型(LLM)驱动的搜索框架 AdaInit,该框架迭代地搜索 QNNs 的最优初始参数以最大化梯度方差,从而减轻 BP。与传统的单次初始化方法不同,AdaInit 使用具有自适应提示的 LLM 动态细化 QNN 的初始化。期望改进(EI)的理论分析证明了搜索的上界,确保该过程最终可以识别出 QNN 的最优初始参数。在四个公开数据集上的广泛实验表明,与经典初始化方法相比,AdaInit 显著提高了 QNN 的可训练性,验证了其在减轻 BP 方面的有效性。