LLM2D

摘要

arXiv:1908.08652v1 类型：交叉摘要：我们提出了一种基于多任务学习（MTL）的深神经网络架构，称为MTCNet（多任务人群网络），用于人群密度和数量估计。人群数量估计由于个体图像的非均匀尺度变化和任意视角而具有挑战性。所提出的模型有两个相关任务，主要任务是人群密度估计，辅助任务是人群计数组分类。辅助任务有助于捕获与主要任务性能改进相关的尺度相关信息。主要任务模型包含两个模块：VGG-16 前端用于特征提取，空洞卷积神经网络用于生成密度图。辅助任务模型与主要任务共享相同的前端，随后是一个CNN分类器。我们提出的网络在不使用任何数据增强的情况下，比最新的方法在ShanghaiTech数据集上分别实现了5.8%和14.9%更低的平均绝对误差（MAE）。我们的模型还在UCF_CC_50数据集上实现了比最新方法10.5%更低的MAE。