LLM2D

摘要

arXiv:2411.10364v2 宣告类型: 替换摘要：从袋标签比例（LDP）学习，即一个具有挑战性的弱监督学习任务，旨在通过使用实例包及其类的比例而非每个实例的标注标签来训练分类器。除了传统的袋级损失外，LDP的主要方法是通过伪标签引入辅助实例级损失，伪标签由预测形成。不幸的是，我们实证观察到伪标签由于过度平滑往往不准确，特别是在包大小较大的场景中，这损害了分类器的诱导。为了缓解这个问题，我们建议了一种新的LDP方法，即带有辅助高置信度实例级损失的从标签比例学习（L^2P-AHIL）。具体而言，我们提出了一种基于双重熵的权重（DEW）方法，以自适应地衡量伪标签的置信度。它同时强调准确的袋级预测，并避免过度平滑的预测。然后，我们使用DEW形成高置信度实例级损失，并以自我训练的方式与袋级损失联合优化。基准数据集上的实验结果显示，L^2P-AHIL 可以超过现有的基线方法，性能提升在包大小增加时更为显著。我们的方法的实现可在 https://github.com/TianhaoMa5/LLP-AHIL 获得。