1.一种基于内容感知模块的人群密度估计方法,其特征在于,包括:对待预测的图像数据进行预处理;
根据处理后的所述图像数据提取深层语义信息和多层融合上下文信息;
基于内容感知模块根据所述深层语义信息动态生成内容感知参数;
将根据所述内容感知参数对人群密度估计模块卷积层的权重和偏移量进行初始化;
将所述多层融合上下文信息输入初始化后的所述人群密度估计模块,得到人群密度图像。
2.根据权利要求1所述的方法,其特征在于:将处理后的所述数据输入卷积神经网络模型;
所述卷积神经网络模型包括特征提取模块、内容感知模块和人群密度估计模块;
所述特征提取模块根据处理后的所述图像数据提取深层语义信息和多层融合上下文信息。
3.根据权利要求2所述的方法,其特征在于:所述特征提取模块包括主干网络和特征融合网络;
所述主干网络包括一层卷积层和四层残差层,对处理后的所述图像数据进行一系列卷积、下采集、上采集,得到了所述深层语义信息;
所述特征融合网络采用特征金字塔网络,通过特征拼接方式融合所述主干网络中一层卷积层和四层残差层的输出特征,得到所述特征融合上下文信息。
4.根据权利要求2所述的方法,其特征在于:所述卷积神经网络模型的训练过程包括:对训练用图像数据进行数据预处理、数据增强处理和多尺度变换;
对主干网络、特征融合网络和内容感知模块的参数进行初始化;
将变换后的所述图像数据送入所述卷积神经网络模型,经特征提取模块获得深层语义信息和多层融合上下文信息;
经所述内容感知模块将所述深层语义信息转化为卷积层的权重和偏移量,并加载到所述人群密度估算模块的卷积层;
将多层融合上下文信息送入人群密度估算模块得到人群密度图像;
通过均方误差函数训练人群密度图像,得到主干网络、特征融合网络和内容感知模块的参数。
5.根据权利要求4所述的方法,其特征在于,所述多尺度变化方法为:利用自适应高斯核生成图像的真值人群密度图;
对图像和真值人群密度图每隔5个epoch进行一次双线性插值缩放;
对于缩放后的图像估计得到的所述人群密度图像,最后需通过公式进行像素值变换处理,公式为:
其中,
Ratio为变换系数;
表示双线性插值缩放前人群密度图像像素值总和;
表示双线性插值缩放后人群密度图像像素值总和;
表示最终得到的人群密度图像的像素值。
6.根据权利要求4所述的方法,其特征在于:所述数据增强处理包括对图像数据进行随机裁剪、随机平移、随机水平翻转、随机亮度和随机擦除。
7.根据权利要求1所述的方法,其特征在于:所述内容感知模块包括三层1×1卷积和四组参数生成模块,每组所述参数生成模块包括3×3卷积和平均池化层;
所述深层语义信息经过三层1×1卷积和四组参数生成模块得到四组内容感知参数。
8.根据权利要求7所述的方法,其特征在于:所述人群密度预测模块包括四组1×1卷积;
根据四组所述内容感知参数分别对人群密度预测模块的四组所述1×1卷积的权重和偏移量进行初始化。
9.根据权利要求8所述的方法,其特征在于:所述人群密度预测模块的四组1×1卷积,通道数分别为512、256、128、2;
四组所述1×1卷积依次对所述多层融合上下文信息进行图像通道降维,得到通道数为
2的人群密度特征图;
对所述人群密度特征图进行热力图分析与整体积分,得到所述人群密度图像和图像中的人群总数。
10.一种实现如权利要求1~9任一项所述的人群密度估计方法的系统,其特征在于,包括:图像数据处理模块、特征提取模块、内容感知模块和人群密度估计模块;
所述信息获取模块,用于:
对待预测的图像数据进行预处理;
所述特征提取模块,用于:
根据处理后的所述图像数据提取深层语义信息和多层融合上下文信息;
所述内容感知模块、用于:
根据所述深层语义信息动态生成内容感知参数;
所述人群密度估计模块,用于:根据所述内容感知参数对卷积层的权重和偏移量进行初始化;
根据所述多层融合上下文信息进行人群密度估计,得到人群密度图像。