1.一种基于OMCR-YOLO网络的车辆目标检测方法,其特征在于,包括如下步骤:
步骤1、获取道路交通的开源数据集,所述数据集标识有类别标签、时间标签和天气标签;
步骤2、配置模型训练环境;
步骤3、构建OMCR-YOLO网络模型,所述OMCR-YOLO网络模型以YOLOv8网络作为基础网络,所述YOLOv8网络包括主干网络、颈部网络和头部网络,在所述主干网络的前端引入全核网络,将所述主干网络中的C2f模块替换为CRR模块,所述主干网络和颈部网络中的下采样卷积替换为可变形卷积增强模块,将所述头部网络中的原始检测头更换为残差深度卷积注意力头;
所述全核网络包括依次连接的3×3卷积、三级残差卷积组、全核模块、2组1×1卷积及残差卷积组和3×3卷积;
所述CRR模块中,首先使用1×1卷积将输入特征图的通道数调整到预定值m,随后通过分割操作将输入分为两个分支,每个分支的通道数为0.5m;其中第一个分支经过n个Bottle2neck_RFAConv处理,每个Bottle2neck_RFAConv会生成一个通道数为0.5m的残差连接;另一个分支直接与Bottle2neck_RFAConv处理完的特征图进行拼接,得到通道数为(n+2)*0.5m的特征图;最后通过一个1×1的卷积将特征图通道数调整为输出通道数c_out;
所述残差深度卷积注意力头将原始检测头中两个并行的3×3卷积合并成一路,并且用轻量化的残差深度卷积替换3×3卷积,然后在残差深度卷积后引入了混合局部通道注意力机制,之后分成两路,分别通过1×1的二维卷积调整通道数,最后计算边界框损失和分类损失;
步骤4、将构建好的OMCR-YOLO网络模型加载至配置好的模型训练环境中,并修改模型的参数文件,并将获取的数据集进行训练和检测;
步骤5、待检测的交通图像数据作为输入,应用完成训练的OMCR-YOLO网络模型进行车辆目标的检测。
2.根据权利要求1所述的一种基于OMCR-YOLO网络的车辆目标检测方法,其特征在于,所述步骤2中,所配置的训练环境为:cuda11.8、深度学习框架pytorch2.3.0、Intel corei9-13900ks CPU、128G内存、GPU为NVIDIA GeForce RTX 4090,显存为24G。
3.根据权利要求1所述的一种基于OMCR-YOLO网络的车辆目标检测方法,其特征在于,所述全核网络中,输入图像首先经过一个3×3卷积进行通道调整和特征提取,随后特征图通过三级残差卷积组进行下采样,然后通过一个全核模块对下采样后的特征图进行处理,随后特征图再通过2组1×1卷积及残差卷积组和3×3卷积将分辨率恢复至初始状态;同时,使用跳跃连接操作将不同层次的特征信息融合。
4.根据权利要求1所述的一种基于OMCR-YOLO网络的车辆目标检测方法,其特征在于,所述全核模块中,输入的特征图通过1×1卷积处理,随后分别经过1×1大小的深度卷积、31×1的深度卷积、31×31的深度卷积、1×31的深度卷积以及由双域通道注意力模块和基于频率的空间注意力模块组成的分支处理,最后五个分支输出的结果与全核模块中输入侧的1×1卷积输出的特征图进行相加再经过一个1×1卷积处理。
5.根据权利要求1所述的一种基于OMCR-YOLO网络的车辆目标检测方法,其特征在于,所述可变形卷积增强模块进行数据增强的方法,表达式如下:其中,y(p0)表示的是可变形卷积的输出,Δpn是学习到的偏移量,Δmn是调制因子,p0是输出特征图中的位置,pn是卷积核的每个采样点,ω(pn)是卷积核权重,R是采样窗口。
6.根据权利要求5所述的一种基于OMCR-YOLO网络的车辆目标检测方法,其特征在于,所述Bottle2neck_RFAConv以Bottle2neck为基础机构,将中间负责特征提取的普通卷积替换为感受野注意力卷积。
7.根据权利要求6所述的一种基于OMCR-YOLO网络的车辆目标检测方法,其特征在于,所述感受野注意力卷积的具体过程表达式如下:W(x)=Softmax(AvgPool2d(x)*Conv2d(x))
F(x)=ReLU(BN(Conv2d(x)))
O(x)=F(x)⊙W(x)
ORFAConv=Conv2d(rearrange(O(x)))
其中,AvgPool2d(·)表示对输入的特征图做平均池化,Conv2d(·)表示深度卷积,按照通道数生成对应的权重;ReLU(·)表示激活函数,Conv2d(·)表示生成特征的卷积操作,BN(·)表示批归一化操作;F(·)表示生成的特征,W(·)表示生成的权重,⊙表示元素乘法;Conv2d(·)表示调整通道数的卷积操作,使输出通道数与输入通道数相同,rearrange(·)表示形状转换操作,O(·)表示加权特征,ORFAConv表示感受野注意力卷积的输出。
8.根据权利要求7所述的一种基于OMCR-YOLO网络的车辆目标检测方法,其特征在于,所述残差深度卷积采用深度卷积,并在深度卷积上加入残差连接。
9.根据权利要求1所述的一种基于OMCR-YOLO网络的车辆目标检测方法,其特征在于,所述训练方法为:训练轮次为300轮,每一轮输入8张图片,训练过程中通过Wandb实时观察训练日志,并在训练完成之后保存权重文件。