摘要
arXiv:2502.08436v1 宣告类型: cross
摘要: 我们提出了标签空间缩减(Label Space Reduction,LSR),这是一种改进大型语言模型(LLMs)零样本分类性能的新方法。LSR 通过系统地对候选类别进行排名和缩减,逐步细化分类标签空间,从而使模型能够集中处理最相关的选项。利用无标签数据和数据驱动模型的统计学习能力,LSR 在测试时动态优化标签空间表示。我们在七个基准上的实验结果表明,与标准的零样本分类 baseline 相比,LSR 在 Llama-3.1-70B 上将宏观F1分数提高了平均 7.0%(最高 14.2%),在 Claude-3.5-Sonnet 上提高了 3.3%(最高 11.1%)。为了减少 LSR 的计算开销(每次迭代都需要额外的 LLM 调用),我们提出了将模型精简为概率分类器的方法,从而实现高效的推理。