1.一种基于DenseNet网络改进的手势图像特征提取方法,其特征在于:包括如下步骤:
1)对各种手势进行图像采集获得原始图像,对原始图像进行尺寸归一化处理获得原始手势图像;
2)对原始手势图像经过卷积降采样网络结构处理进行多次卷积降采样,选取卷积降采样网络结构中较浅层的特征张量和深层的特征张量;
3)将较浅层的特征张量和深层的特征张量分别输入到融合了Drop‑Path模块的DenseNet‑B模块中得到两种包含不同尺度语义信息的通道数扩增后的特征张量;
4)将获得的两种包含不同尺度语义信息的通道数扩增后的特征张量进行融合,得到多尺度特征融合的特征张量;
5)将获得的多尺度特征融合的特征张量经过过渡层进行压缩,压缩后再次输入到融合了Drop‑Path模块的DenseNet‑B模块中,得到包含多尺度高维度的特征张量;
6)将多尺度高维度特征张量经过全局平均池化层,再经过全连接层,再通过softmax分类器得到手势图像的分类结果。
2.根据权利要求1所述的一种基于DenseNet网络改进的手势图像特征提取方法,其特征在于:所述的卷积降采样网络结构主要由四个连续的二阶卷积模块和一个三阶卷积模块和一个上采样层依次连接构成;
所述的二阶卷积模块主要由进行降采样的stride=2的第一个卷积层、1×1的第二个卷积层、批量归一化层和RELU激活层依次连接构成;
所述的三阶卷积模块是在二阶卷积模块基础上添加了一个瓶颈层后组成,瓶颈层的具体位置是在二阶卷积模块中两个卷积层之后、批量归一化层之前;
所述的上采样层是采用最近邻(nearest)插值算法进行;
选取第三个二阶卷积模块和上采样层的输出分别作为较浅层的特征张量和深层的特征张量。
3.根据权利要求2所述的一种基于DenseNet网络改进的手势图像特征提取方法,其特征在于:所述的二阶卷积模块f2(z)和三阶卷积模块f3(z)具体按照以下公式设置表示:其中,z代表输入的图像, 代表卷积核尺寸为i×i、输出通道数为n的卷积函数,a、b、c表示卷积降采样网络结构中不同卷积模块第一个卷积层、第二个卷积层和瓶颈层输出特定的通道数;BN(*)代表批量归一化函数;δ(*)代表RELU激活函数。
4.根据权利要求1所述的一种基于DenseNet网络改进的手势图像特征提取方法,其特征在于:所述的DenseNet‑B模块主要由多个密集层组成,每一个密集层是由两个连续的卷积模块BRC组成,两个卷积模块BRC拓扑结构相同但参数不同,卷积模块BRC是由一个批量归一化层、RELU激活层和一个单卷积层顺序连接而成;两个卷积模块BRC的区别在于单卷积层中卷积核的大小不同;卷积模块BRC由以下公式设置表示:其中,z代表输入的图像,BN(*)代表批量归一化函数;δ(*)代表RELU激活函数,代表卷积核尺寸为i×i、输出通道数为n的卷积函数;BRC(*)表示卷积模块BRC的函数。
5.根据权利要求4所述的一种基于DenseNet网络改进的手势图像特征提取方法,其特征在于:所述的DenseNet‑B模块中,第一密集层的输入是卷积降采样网络结构中选取的特征张量,其余每个密集层的输入均包括卷积降采样网络结构中选取的特征张量和位于自身前面的所有密集层的输出,由卷积降采样网络结构中选取的特征张量和所有密集层的输出共同连接作为DenseNet‑B模块的输出;DenseNet‑B模块由以下公式设置表示:其中,X0表示第一密集层的输入,Xl表示第L层密集层的输出,Hl表示第L层的两个卷积核大小不同的卷积模块BRC, 表示通道维度上的叠加。
6.根据权利要求1所述的一种基于DenseNet网络改进的手势图像特征提取方法,其特征在于:所述的融合Drop‑Path模块的DenseNet‑B模块是在DenseNet‑B模块上的每一层密集层之前设置Drop‑Path函数随机丢弃输入子路径;
融合Drop‑Path模块的DenseNet‑B模块由以下公式进行设置表示:其中,Drop‑Pathn(*)表示Drop‑Path函数,下标n表示设置的丢弃率。
7.根据权利要求1所述的一种基于DenseNet网络改进的手势图像特征提取方法,其特征在于:所述的过渡层主要是由卷积池化模块BRCM组成,卷积池化模块BRCM是在卷积模块BRC基础上在最后增加了一个最大池化层,卷积池化模块BRCM可以用以下公式设置表示:其中, 代表步长为2、卷积核大小为2×2的最大池化层。