摘要
arXiv:2505.09742v1 宣告类型: 交叉
摘要: 我们提出了一种生成式、端到端解决白盒组合优化问题的方法,该方法在NP问题上兼顾样本效率和解的质量。受基于退火算法的启发,我们将白盒目标函数视为能量函数,并训练一个神经网络来模拟相关的玻尔兹曼分布。通过对温度进行条件化处理,网络可以捕捉从高温时近乎均匀到低温时围绕全局最优解尖峰的连续分布,从而学习能量景观的结构并促进全局优化。当查询昂贵时,依赖温度的分布自然地支持数据增强,提高样本效率。当查询便宜但问题仍然困难时,模型学习隐含的变量交互,实际上“打开了”白盒。我们在有限和无限查询预算下的具有挑战性的组合任务中验证了我们的方法,显示出与当前最先进的黑盒优化器竞争的性能。