LLM2D

摘要

arXiv:2502.08696v1 交叉公告类型摘要：从复杂非规范分布中对离散域进行采样已成为统计物理、变分推断和组合优化领域的一个有前景的研究方向。最近的工作展示了在该领域中扩散模型的潜力。然而，现有的方法在内存扩展方面存在限制，因此可实现的扩散步骤数量有限，因为它们需要对整个生成过程进行反向传播。为克服这些限制，我们提出了两种新型的离散扩散采样器训练方法，一种基于策略梯度定理，另一种利用自规范化神经重要性采样（SN-NIS）。这些方法实现内存高效的训练，并在无监督组合优化中达到了最先进的结果。此外，许多科学应用还需要无偏采样的能力。我们提出了SN-NIS和神经马尔可夫链蒙特卡洛的适应性，这使得离散扩散模型首次能够应用于这个问题。我们在Ising模型基准上验证了我们的方法，并发现它们优于流行的自回归方法。我们的工作为将扩散模型应用于广泛科学应用中的离散域开辟了新的途径，这些应用以往受限于精确似然模型。