LLM2D

摘要

密集特征对于检测图像中的微小物体至关重要。然而，尽管 CNN 模型在多尺度目标检测方面具有显著的有效性，但由于池化过程中的密集特征丢失，CNN 模型通常无法检测图像中的较小物体。空洞卷积通过应用稀疏内核来解决这个问题。然而，稀疏内核通常会导致 CNN 模型的多尺度检测效能下降。在本文中，我们提出了一种基于 EfficientDet 模型的可切换（自适应）空洞卷积网络（SAC-Net）的目标检测模型。固定的空洞率限制了 CNN 模型在卷积层中的性能。为了克服这一限制，我们引入了一种可切换机制，允许在正向传递期间动态调整空洞率。所提出的 SAC-Net 集成了低级特征和高级特征的优点，从而在不丢失密集特征的情况下，在多尺度目标检测任务中取得了更好的性能。此外，我们将深度可切换空洞率应用于所提出的网络，以改善尺度不变特征。最后，我们将全局上下文应用于所提出的模型。我们在基准数据集上的大量实验表明，所提出的 SAC-Net 在准确性方面显著优于最先进的模型。