LLM2D

摘要

arXiv:2502.04268v1 宣告类型: cross 摘要：随着定向对象检测（OOD）需求的迅速增加，最近对从点标注学习OOD的弱监督检测器的研究引起了极大的关注。在本文中，我们重新思考了这个具有挑战性的任务设置，并提出了Point2RBox-v2。核心包含三个原则：1）高斯重叠损失。通过将物体视为二维高斯分布并最小化它们的重叠来学习每个实例的上限。2）沃罗尼瓦什勒损失。通过沃罗尼瓦什勒瓦什勒方块中的watershed学习每个实例的下限。3）一致性损失。学习相对于输入图像及其增强视图的两个输出集之间的大小/旋转变化。通过一些精心设计的技术，例如边缘损失和复制粘贴，检测器进一步得到增强。据我们所知，Point2RBox-v2 是第一个探索实例之间空间布局以学习点监督 OOD 的方法。我们的解决方案既优雅又轻量级，但预计在稠密场景中会表现得尤为出色：在 DOTA/HRSC/FAIR1M 上的得分分别为 62.61%/86.15%/34.71%。代码可在 https://github.com/VisionXLab/point2rbox-v2 获取。