1.一种基于数据流模式的深度卷积神经网络推理加速方法,其特征在于,包括以下步骤:S1:以流模式获取图像数据;
所述的流模式对图像帧数据以一行数据为最小数据输入单位输入到卷积神经网络中;
S2:纵向对流模式数据进行前向计算,通过流模式建立卷积神经网络两层之间的前向推理计算,包括对卷积层的操作、对非线性层的操作和对池化层的操作;
所述的对卷积层的操作为:
当卷积核大小为K*K,步长为D的卷积层获取到前K行流模式数据后,立即将K行数据同卷积核进行卷积操作;
当获取前(K+D)行流模式数据后,立即将第D行至第(K+D)行数据同卷积核进行卷积操作;
以步长D依次对各行数据进行卷积操作,直到最后一行数据;
所述的对非线性层的操作为:
每获取一行流模式数据,立即进入非线性操作;对每个输入数据,当输入小于0时,输出为0;当输入大于0时,输出等于输入;
所述的对池化层的操作为:
当池化窗口大小为C*C,步长为D的池化层获取到前C行流模式数据后,立即将C行数据进行池化操作;
当获取前(C+D)行流模式数据后,立即将第D行至第(C+D)行数据进行池化操作;
以步长D依次对各行数据进行池化操作,直到最后一行数据;
S3:横向对流模式数据进行前向计算,当上一层的输出数据行数满足下一层的操作要求时,下一层同步进行对应操作,建立卷积神经网络多层之间的前向推理计算。
2.根据权利要求1所述的一种基于数据流模式的深度卷积神经网络推理加速方法,其特征在于,在横向对流模式数据进行前向计算过程中:当上一层计算层获得到流模式数据满足操作要求后,立即对该数据进行对应的计算操作;然后以相应的步长依次对各行数据进行对应的计算操作;
当上一层计算层输出的数据满足下一层计算层的操作要求后,立即对该输出数据进行对应的计算操作;然后以相应的步长依次对各行输出数据进行对应的计算操作;
依次对各计算层进行同步前向计算操作。
3.根据权利要求2所述的一种基于数据流模式的深度卷积神经网络推理加速方法,其特征在于,所述的计算层包括但不限于卷积层、池化层、非线性层和全连接层。