LLM2D

摘要

arXiv:2505.01595v1 类型:交叉研究摘要:我们提出了一种最先进的模型，用于在给定上下文的情况下进行细粒度的概率估计。近年来，大型语言模型（LLMs）在推理能力方面有了显著提升，特别是在具有完整信息的明确任务上。然而，LLMs 在不确定性或部分信息下进行准确且校准良好的概率预测方面仍然存在困难。虽然将不确定性纳入模型预测通常能提升性能，但获得可靠的不确定性估计仍然是一个未被充分研究的领域。特别是，LLMs 的概率估计往往较为粗糙，并倾向于偏向更频繁出现的数字。通过结合人工和合成数据的创建与评估、扩大模型规模以及改进监管，我们提出了一组强而精的概率估计模型。我们在依赖条件概率估计的任务中进行了系统评估，并展示了我们的方法在很大程度上优于现有调整和提示为基础的方法。