摘要
arXiv:2504.01128v1 交叉公告类型: cross
摘要: 环流是强、局部和狭窄的水流,它们向外流入海洋,导致全球各地海滩相关的大量伤害和死亡。由于环流的非规范化特性和缺乏标注数据,准确识别环流仍然具有挑战性,往往需要专家知识。为了解决这些问题,我们提出了 RipVIS,一个专门为环流分割设计的大规模视频实例分割基准数据集。RipVIS 的规模比以往的数据集大一个数量级,包含了 184 个视频(212,328 帧),其中 150 个视频(163,528 帧)含有环流,这些视频来自各种来源,包括无人机、移动电话和固定海滩摄像头。我们的数据集涵盖了多种视觉环境,如海浪破碎模式、淤泥流动和水色变化,遍布多个全球地点,包括美国、墨西哥、危地马拉、葡萄牙、意大利、希腊、罗马尼亚、斯里兰卡、澳大利亚和新西兰。绝大多数视频以 5 帧每秒的速度进行标注,以确保在动态场景下确保准确性,并补充了 34 个不含环流的视频(48,800 帧)。我们使用 Mask R-CNN、Cascade Mask R-CNN、SparseInst 和 YOLO11 进行全面实验,这些模型被微调以进行环流分割任务。结果用多个指标报告,特别关注 F2 分数以优先考虑召回并减少假阴性。为了提高分割性能,我们引入了一种基于时间置信度聚合 (TCA) 的新颖后处理步骤。RipVIS 旨在为环流分割设定新的标准,有助于创建更安全的海滩环境。我们提供了一个基准网站,分享数据、模型和结果给研究社区,鼓励持续合作和未来贡献,网址为 https://ripvis.ai。