LLM2D
自适应卷积与统一全局局部上下文相结合的尺度不变目标检测
Scale-Invariant Object Detection by Adaptive Convolution with Unified Global-Local Context
作者: Amrita Singh, Snehasis Mukherjee
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2410.05274v1

摘要

密集特征对于检测图像中的微小物体至关重要。然而,尽管 CNN 模型在多尺度目标检测方面具有显著的有效性,但由于池化过程中的密集特征丢失,CNN 模型通常无法检测图像中的较小物体。空洞卷积通过应用稀疏内核来解决这个问题。然而,稀疏内核通常会导致 CNN 模型的多尺度检测效能下降。在本文中,我们提出了一种基于 EfficientDet 模型的可切换(自适应)空洞卷积网络(SAC-Net)的目标检测模型。固定的空洞率限制了 CNN 模型在卷积层中的性能。为了克服这一限制,我们引入了一种可切换机制,允许在正向传递期间动态调整空洞率。所提出的 SAC-Net 集成了低级特征和高级特征的优点,从而在不丢失密集特征的情况下,在多尺度目标检测任务中取得了更好的性能。此外,我们将深度可切换空洞率应用于所提出的网络,以改善尺度不变特征。最后,我们将全局上下文应用于所提出的模型。我们在基准数据集上的大量实验表明,所提出的 SAC-Net 在准确性方面显著优于最先进的模型。