LLM2D
RipVIS:海滩监测与安全的 rip 流动视频实例分割基准
RipVIS: Rip Currents Video Instance Segmentation Benchmark for Beach Monitoring and Safety
作者: Andrei Dumitriu, Florin Tatui, Florin Miron, Aakash Ralhan, Radu Tudor Ionescu, Radu Timofte
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2504.01128v2

摘要

arXiv:2504.01128v2 通知类型: 交叉替换 摘要: 潮流是强且局部狭窄的水流,向外流入海洋,导致世界各地发生大量的海滩相关受伤和死亡事件。由于潮流的无定形性质以及缺乏标注数据,准确识别潮流仍然具有挑战性,这通常需要专家知识。为了应对这些问题,我们提出了RipVIS,这是一个明确为潮流分割设计的大规模视频实例分割基准。RipVIS 的规模比之前的数据集大一个量级,包含184个视频(212,328帧),其中150个视频(163,528帧)包含潮流,这些视频来自多种来源,包括无人机、手机和固定的海滩相机。我们的数据集涵盖了多种视觉场景,包括波破碎模式、沉积物流动和水色变化,这些场景跨越多个全球地点,包括美国、墨西哥、危地马拉、葡萄牙、意大利、希腊、罗马尼亚、斯里兰卡、澳大利亚和新西兰。大多数视频以5 FPS标注,以确保在动态场景中保持准确性,同时有34个无潮流的额外视频(48,800帧)。我们使用Mask R-CNN、Cascade Mask R-CNN、SparseInst和YOLO11进行了全面的实验,并针对潮流分割任务对这些模型进行了微调。结果使用多个指标报告,特别关注F2分数以优先考虑召回并减少假阴性。为了提高分割性能,我们引入了一种新的后处理步骤,基于时间置信度聚合(TCA)。RipVIS旨在为潮流分割树立新的标准,以促进更安全的海滩环境。我们提供了一个基准网站,与研究社区分享数据、模型和结果,并鼓励持续合作和未来贡献,网址为https://ripvis.ai。