LLM2D
基于多注释三元损失的多任务学习以改善目标检测
Multi-Task Learning with Multi-Annotation Triplet Loss for Improved Object Detection
作者: Meilun Zhou, Aditya Dutt, Alina Zare
发布日期: 4/14/2025
arXiv ID: oai:arXiv.org:2504.08054v1

摘要

arXiv:2504.08054v1 交叉公告类型: 摘要:三重损失传统上仅依赖于类别标签,并未在多种注释类型可供使用的多任务场景中利用所有可用信息。本文提出了一种多注释三重损失(MATL)框架,通过在损失函数中结合其他注释(如边界框信息)和类别标签来扩展三重损失。通过利用这些互补注释,MATL 在需要同时进行分类和定位的任务中改善了多任务学习。在空中野生动物图像数据集上的实验证明,MATL 在分类和定位方面均优于传统的三重损失。这些发现强调了在多任务学习框架中使用所有可用注释对三重损失的益处。