LLM2D

摘要

arXiv:2402.06038v2 Announce Type: replace-cross 摘要：先验不变表示学习（PIRL）随后进行监督微调（SFT）已成为在有限标签情况下学习的标准范式。我们将其扩展到正未标记（PU）设置中，在这种设置中，只有少量标记的正样本和一个未标记的大池——该池包含正样本和负样本。我们研究了该问题的两种情况：（i）不访问类先验；以及（ii）知道或可以通过估计类先验的情况。我们引入了正未标记对比学习（puCL），这是一种无偏且方差减少的对比目标，它巧妙地将标记的正样本的弱监督集成到对比损失中。当知道类先验时，我们提出了一种先验感知的正未标记InfoNCE（puNCE），这是一种重新加权未标记样本为软正负混合物的扩展。对于下游分类，我们开发了一种伪标签算法，该算法通过PU感知聚类利用学习到的嵌入空间的结构。我们的框架得到了理论的支持；它提供了偏差方差分析、收敛洞察和通过增强集中提供的泛化保证；并通过标准PU基准测试得到了实验证明，在低监督情况下它始终优于现有方法。