LLM2D

摘要

arXiv:2503.11339v2 宣告类型: replace-cross 摘要：不确定性量化是强化学习和深度学习的关键方面，具有广泛的应用，从有效的探索和稳定的离线强化学习到医学诊断中的异常检测。然而，现代神经网络的规模使得许多理论上具有充分动机的方法，如完全贝叶斯推断变得复杂。近似方法，如深集成模型，可以提供可靠的不确定性估计，但仍具有高昂的计算成本。在本文中，我们提出了一种新颖的方法——上下文相似性蒸馏，该方法可以通过单一模型显式估计深神经网络集成的方差，而无需事先学习或评估这样的集成。我们的方法基于宽神经网络由神经切线核所治理的学习动态，从而推导出无限集成预测方差的有效近似。具体而言，我们将集成方差的计算重新解释为一个以核相似性为目标的监督回归问题。由此产生的模型可以在推理时仅通过一次前向传播来估计预测方差，并且可以利用未标记的目标域数据或数据增强来改进其不确定性估计。我们跨不同分布外检测基准和稀疏奖励强化学习环境中 empirically 检验证了我们的方法。我们发现，我们的单一模型方法在性能上与基于集成的方法竞争，有时甚至更优，并且可作为有效探索的可靠信号。我们认为，这些结果将上下文相似性蒸馏定位为强化学习和一般深度学习中不确定性量化的一个原则性和可扩展的替代方案。