LLM2D
使用随机噪声预训练进行不确定性校准
Pretraining with random noise for uncertainty calibration
作者: Jeonghwan Cheon, Se-Bum Paik
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2412.17411v2

摘要

arXiv:2412.17411v2 通告类型: replace-cross 摘要:不确定性校准对于各种机器学习应用至关重要,但仍然极具挑战性。许多模型会表现出幻觉现象——即自信但不准确的响应——这是由于信心的误校准所致。在这里,我们证明了在深度学习中常见的随机初始化做法,尽管通常被认为是一种标准技术,实际上却是一个潜在的原因,导致未经训练的网络拥有过高的信心。我们的方法受到发育神经科学的启发,通过在预训练网络时使用随机噪声和标签来简单地解决这个问题,从而减少过高的信心,并将初始信心水平拉近随机猜测的水平。这确保了在后续数据训练过程中达到最优校准,使信心与准确性保持一致,无需额外的预处理或后处理步骤。预校准的网络在识别“未知数据”方面表现出色,对外分布输入显示较低的信心,从而解决了信心校准问题。