LLM2D

摘要

arXiv:2412.05331v3 宣告类型: replace-cross 摘要：本项目旨在开发一种稳健的视频监控系统，该系统可以根据活动检测将视频分割成更小的片段。它使用闭路电视(CCTV)录像，仅记录重要的事件，如人的出现或小偷，从而优化存储并使数字搜索更简便。该项目利用了最新的目标检测和跟踪技术，包括卷积神经网络（CNNs）如YOLO、SSD和Faster R-CNN，以及循环神经网络（RNNs）和长短期记忆网络（LSTMs），以实现高精度检测并捕捉时间依赖性。该方法通过高斯混合模型（GMM）和光流方法如卢卡斯-卡纳德（Lucas-Kanade）进行自适应背景建模，用以检测运动。多尺度和上下文分析被用来提高不同对象大小和环境下的检测精度。通过结合统计模型和深度学习模型的混合运动分割策略来管理复杂运动，同时对实时处理的优化确保了高效的计算。使用卡尔曼滤波器和双目网络等跟踪方法来在遮挡情况下保持平滑跟踪。通过多尺度和上下文分析在不同场景下对不同大小的对象进行检测效果得到了提高。结果表明，这项研究在检测和跟踪物体方面具有高精度和召回率，并且由于实时优化和光照不变特征，处理时间和准确性有了显著提高。这项研究的影响在于，它有可能变革视频监控，减少存储需求并通过可靠和高效的物体检测与跟踪提高安全性。