LLM2D

摘要

arXiv:2504.21773v1 类型: cross 摘要：随着大规模语言模型（LLMs）的广泛应用，生成不存在的事实，即幻觉问题，引起了越来越多的关注。增强LLM置信度估计的先前研究主要集中在单一问题设置上。然而，在更具有挑战性的多问题设置中，即同时准确回答多个问题，LLM对其内部参数化知识边界的意识研究仍然不足。为了弥合这一差距，我们提出了一种新颖的方法——多答案和置信逐步调整（MAC-Tuning），该方法在指令数据微调期间将答案预测的学习与置信度估计的学习进行分离。广泛的实验表明，我们的方法在平均精度方面比基线方法高出最多25%。