LLM2D
基于ensemble的方法用于量化基于LLM的分类的不确定性
Ensemble based approach to quantifying uncertainty of LLM based classifications
作者: Srijith Rajamohan, Ahmed Salhin, Josh Frazier, Rohit Kumar, Yu-Cheng Tsai, Todd Cook
发布日期: 2/20/2025
arXiv ID: oai:arXiv.org:2502.08631v2

摘要

arXiv:2502.08631v2 通告类型: 替换 摘要: 大型语言模型(LLMs)的输出是模型内部参数和输入到上下文窗口的数据的函数。这里提出的假设是在贪婪采样策略下,LLM的输出方差是模型参数化知识中嵌入的概念确定性以及输入的词汇方差的函数。通过微调模型,可以减少模型输出对输入词汇变化的敏感性。然后将这种方法应用于分类问题,并提出了一种概率方法来估计预测类别的确定性。