1.一种基于扩张坐标注意力的改进YOLOv3目标检测方法,其特征在于,所述检测方法包括以下步骤:采用具有不同扩张率的并行的多个扩张卷积结构对坐标注意力模块进行改进,引入扩张坐标注意力模块,构建得到改进YOLOv3目标检测网络;采用多尺度训练策略,预先设定多种具有不同尺度的图像对改进YOLOv3目标检测网络进行训练;
所述改进YOLOv3目标检测网络的主干网络是Darknet‑53,包括依次连接的一个3×3的卷积层和5组残差块;输入的图像通过3×3的卷积层后,将通道数调整为32;每个残差块均包括一个1×1的卷积层、一组重复执行的残差单元,自前向后5组残差块分别重复执行1次、
2次、8次、8次和4次;每个残差单元由两个DBL单元构成,每个DBL单元由卷积层、标准化层和激活函数层组成;
浅层特征层和中层特征层上采样的结果进行堆叠,得到中层特征图的预测结果;同样,中层特征图也与同样经过上采样处理的深层特征图进行堆叠,通过堆叠构建特征金字塔,输出三个形状不同的特征层;
所述扩张坐标注意力模块连接在第三个残差块与第二个残差块之间;
所述扩张坐标注意力模块包括残差层、X轴平均池化层、Y轴平均池化层、扩张卷积结构、第一卷积层、BN层、两个第二卷积层、两个激活函数和re‑weight层;
所述残差层的输出端直接与re‑weight层连接;同时,残差层的输出端依次通过呈并联关系的X轴平均池化层和Y轴平均池化层、扩张卷积结构、第一卷积层与BN层的输入端连接;
BN层的输出端分别与两个呈并联结构的第二卷积层和激活函数的组合体连接,两个激活函数的输出端均连接至re‑weight层。
2.根据权利要求1所述的基于扩张坐标注意力的改进YOLOv3目标检测方法,其特征在于,所述多个扩张卷积结构的原始卷积核大小相同,扩张率不同;
根据下述公式计算得到每个扩张卷积结构的实际卷积核大小R:
R=k+(k‑1)(d‑1)=kd‑d+1
其中,d为扩张卷积的扩张率,k为原始卷积核大小。
3.根据权利要求1所述的基于扩张坐标注意力的改进YOLOv3目标检测方法,其特征在于,三个特征层的大小分别为52×52、26×26和13×13。
4.根据权利要求1所述的基于扩张坐标注意力的改进YOLOv3目标检测方法,其特征在于,采用多尺度训练策略,预先设定多种具有不同尺度的图像对改进YOLOv3目标检测网络进行训练的过程包括以下步骤:预先设定一个尺度范围,训练时每隔一些batches在该尺度范围内随机更改输入图像的尺寸,且为32的倍数;
不改变网络结构,针对更改得到的多尺度的输入图像,仍由单个尺度进行训练。