1.一种基于注意力神经网络场的人群计数方法,其特征在于:包括以下步骤:
S1:在卷积神经网络的编码器F-解码器H架构中,向所述解码器H的第1-4层内加入条件随机场和注意力机制,构建注意力神经网络场;
S2:将所述注意力机制作用于层内和层间,得到层内注意力变量A和层间注意力变量M;
S3:对层内注意力变量A、层间注意力变量M以及解码器H进行优化,将感受野扩展至整个图像。
2.根据权利要求1所述的一种基于注意力神经网络场的人群计数方法,其特征在于:所述编码器F和解码器H均包括6个残差卷积块,每个所述残差卷积块均对特征映射做下采样,且输出具有相同通道数量的特征映射。
3.根据权利要求2所述的一种基于注意力神经网络场的人群计数方法,其特征在于:所述残差卷积块包括64个滤波器组,位于所述编码器F中的64个滤波器组的后端连接有2×2的最大池化层。
4.根据权利要求1所述的一种基于注意力神经网络场的人群计数方法,其特征在于:所述注意力神经网络场包括编码器F中各层的滤波器参数、解码器H中各层的滤波器参数、层内注意力变量A以及层间注意力变量M。
5.根据权利要求4所述的一种基于注意力神经网络场的人群计数方法,其特征在于:所述编码器F中各层的滤波器参数均由ImageNet训练得到,所述注意力神经网络场的网络结构参数包括{H,A,M}。
6.根据权利要求1所述的一种基于注意力神经网络场的人群计数方法,其特征在于:所述S2中层内注意力变量A为矩阵结构,所述矩阵的行和列均为相应层的特征映射图的像素大小。
7.根据权利要求1所述的一种基于注意力神经网络场的人群计数方法,其特征在于:所述S2中层间注意力变量M为矩阵结构,所述矩阵的行和列大小分别是相邻两个层次间特征映射图的像素个数。
8.根据权利要求1所述的一种基于注意力神经网络场的人群计数方法,其特征在于:所述S3中层内注意力变量A的优化实现过程包括三个步骤,所述第一步骤为计算中间变量所述第二步骤为计算层内注意力变量 所述第三步骤为使用softmax函数实现层内注意力变量的归一化。
9.根据权利要求1所述的一种基于注意力神经网络场的人群计数方法,其特征在于:所述S3中层间注意力变量M的优化实现过程包括三个步骤,所述第一步骤为计算中间变量所述第二步骤为计算层间注意力变量 所述第三步骤为使用softmax函数实现层间注意力变量的归一化。
10.根据权利要求1所述的一种基于注意力神经网络场的人群计数方法,其特征在于:所述S3中解码器H的优化实现过程包括三个步骤,所述第一步骤为计算中间变量 所述第二步骤为计算中间变量 所述第三步骤为更新特征映射