欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 202410384762X
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-01-27
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于LLC-YOLO算法的车辆目标检测,其特征在于,包括如下步骤:步骤1、获取图像数据集,并通过脚本对数据集进行筛选,筛选得到标签为夜晚的图片,进而将标签文件从JSON格式转换为YOLO格式;

步骤2、构建LLC-YOLO模型,所述LLC-YOLO模型包括LLC-Net、主干网络backbone、颈部网络CMCF-Neck和head;所述主干网络backbone应用YOLOv5,所述CMCF-Neck以YOLOv5颈部网络为主要网络架构,所述YOLOv5颈部网络中的C3模块中,使用CMConv卷积替代普通卷积Conv重构成M3模块;

所述CMConv的卷积结构,输入通道数为c1的特征,通过普通卷积将通道数变为c2/2,然后通过深度可分离卷积得到c2/2的特征图,通过Concat把普通卷积和深度可分离卷积的输出连接起来,接着使用Shuffle操作将普通卷积和深度可分离卷积的对应通道匹配连接在一起,得到输出通道数为c2的特征图;

步骤3、通过LLC-Net对筛选出的夜晚图片进行低光增强;

所述低光增强的方法为:通过LLC-Net中的拉普拉斯金字塔将输入的图像分为不同尺度的特征图L0、L1、L2、L3;在不同尺度的特征图Li(i=0、1、2、3)上使用LLC-Net中图像增强模块处理潜在的语义特征;通过自下而上的方式,输入为L3的图像增强模块通过上采样后输出与输入为L2的图像增强模块的输出连接在一起,以此方式向上递推最在终输入为L0的图像增强模块得到包含不同尺度信息的特征图;

所述图像增强模块包括通过Concat连接的自适应低通滤波器和边缘信息提取模块;

步骤4、通过backbone对低光增强后的图片进行特征提取;

步骤5、通过CMCF-Neck进行通道间的特征融合;

步骤6、通过head输出检测结果。

2.根据权利要求1所述的一种基于LLC-YOLO算法的车辆目标检测,其特征在于,所述数据集预处理后按照8:1:1的比例划分为训练集、验证集和测试集。

3.根据权利要求1所述的一种基于LLC-YOLO算法的车辆目标检测,其特征在于,所述自适应低通滤波器的实现方式:在不同尺度的图像中,使用自适应低通滤波器捕获各个通道中的低频信息,并使用1*1、2*2、3*3、6*6的平均池化进行特征过滤,仅允许低于截至频率的信息通过,其公式如下所示:Filter(fi)=Up(βs(fi))

其中fi表示是channelsplit输出的一部分,Up是双线性插值采样,βs是不同尺寸s×s的自适应平均池化。

4.根据权利要求1所述的一种基于LLC-YOLO算法的车辆目标检测,其特征在于,所述边缘信息提取模块包括上下分支结构和边缘分支结构,上下分支结构定义为:

CB(x)=x+γ(F1(x1))

其中x1=σ(F2(x)).x,x是输入特征,F是3*3大小的卷积层,γ是LeakyReLU,σ是Softmax函数;

边缘分支结构定义为:

EB(x)=F3(Cannyh(x)+Cannyw(x))+x

其中,x是输入特征,Cannyh和Cannyw分别是垂直和水平方向上的边缘运算,F是3*3大小的卷积层。

5.根据权利要求1所述的一种基于LLC-YOLO算法的车辆目标检测,其特征在于,所述CMConv卷积参数量:Flops1=w.h.k1.k2.c1/2+c2/2

其中,w是输出特征图的宽度,h是输出特征图的高度,k1、k2是卷积核的大小,尺寸是3*3,c1是每个卷积核的通道数,也是输入特征图的通道数,c2是输出特征图的通道数。

6.根据权利要求1所述的一种基于LLC-YOLO算法的车辆目标检测,其特征在于,所述LLC-YOLO模型训练时的损失函数表达式如下:L=L(x,c,l,g)+γLRepGT

其中,LRepGT为排斥损失,γ为权重系数,用于平衡辅助损失,用P+={P},表示与真实框IoU大于0.5的所有候选框的集合,G+={G}表示所有真实框的集合;

排斥损失可由以下公式计算得到:

7.根据权利要求6所述的一种基于LLC-YOLO算法的车辆目标检测,其特征在于,所述LLC-YOLO模型部署环境:cuda11.3、深度学习框架pytorch1.12.1、Intel core i9-13900ksCPU、128G内存、GPU为NVIDIA GeForce RTX 4090,显存为24G;训练时,设置的训练次数为100轮次,每次训练输入的batch size为16张,训练过程时通过tensorboard观察训练过程,训练结束后,保存训练好的权重。