知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

一种基于区域聚焦的多尺度道路目标检测方法

面议

专利号： 2022113916699

申请人：江南大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2026-04-06

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于区域聚焦的多尺度道路目标检测方法，其特征在于，所述方法包括：第一步：获取不同场景下的道路图片，将所有道路图片进行统一缩放，并对像素值进行归一化处理作为数据集；

第二步：按照预定比例将数据集划分成训练集和测试集，对训练集中的样本使用改进的k-means-GIOU算法，对训练集样本中的所有真实边界框进行k均值聚类，迭代生成12个先验锚框；其中，所述改进的k-means-GIOU算法是在原先的IOU上添加一项得到GIOU距离作为聚类距离，表达式为：（1）

式中，A和B分别代表真实框和预测框的面积，代表两框的交集面积，代表两框的并集面积，C代表两框组成的最小闭包区域的面积；

第三步：构建YOLOv3-focus模型，所述YOLOv3-focus模型包括特征提取网络、特征融合网络和检测头；其中：所述特征提取网络选用darknet53网络，darknet53网络共包含53个卷积层，并使用残差连接的方法以克服梯度消失的问题；所述特征融合网络采用特征金字塔网络对高低维特征进行充分融合；

所述YOLOv3-focus模型包含四个检测头，首先，为了强化网络的跨尺度检测能力，分别在缩小4、8、16和32倍的特征图上进行检测；在检测缩小4倍的特征图的检测分支中，加入通道与空间注意力模块以及特征图裁剪模块，有助于网络关注到主要道路区域的目标并提高对这些目标的检测能力；所述特征图裁剪模块用于针对部分区域进行特征图的选择裁剪，裁剪条件表达式为：（2）

式中，h、w代表图片的宽高，and代表与操作，or代表或操作；以图片左上角为坐标轴顶点，竖直向下为x轴正方向，水平向右为y轴正方向，则为特征图上某一位置的坐标；若某一位置的坐标符合条件x，则所有通道的该位置的特征图均以0填充；

其次，在每个检测头上采用3个先验锚框进行回归输出，针对每个锚框分别输出置信度、预测边界框位置信息以及每个类别的分数；最后按照特征图缩小尺寸将预测边界框缩放回原图尺寸，再将所有的预测边界框进行非极大值抑制处理得到最终的预测结果；

第四步：将训练集样本输入到所述YOLOv3-focus模型进行训练，包括：加载特征提取网络的预训练权重，并固定darknet53的权重，初始化特征融合网络以及检测头的参数，再将训练集样本按批次输入到所述YOLOv3-focus模型中；

将通过k均值聚类生成的先验锚框分别分配到对应的检测头，将各个检测头上的特征图划分为一个个单元格，然后判断每个单元格内是否包含目标，再依据先验锚框的尺寸在每个单元上进行回归预测；

将回归预测输出的预测框按比例缩放，再采取动态分配算法为每个真实框分配相应数目的正样本；

以为损失函数计算损失函数值并对未冻结的网络部分更新权重，重新执行所述加载特征提取网络的预训练权重的步骤，直至达到设置迭代次数；为提高网络训练效率采取余弦退火学习率进行训练，学习率的值在第一次训练过程中在各个批次间从最终学习率值线性增长至初始学习率值，其后按训练次数变化，同一训练次数时不再在批次间变化学习率，学习率以训练总次数为半个周期按余弦曲线平滑变化；

第五步：输出训练好的网络模型用于道路目标检测，包括：

所述训练集按照第四步的训练方法进行训练；训练完成后，利用所述测试集进行测试，得到平均准确率、召回率和每秒检测数量，最终实现道路目标的跨尺度检测。

2.根据权利要求1所述的基于区域聚焦的多尺度道路目标检测方法，其特征在于，所述YOLOv3-focus模型的损失函数包含三部分，分别是定位损失、置信度损失以及分类损失，每一项前分别有平衡系数、和，表达式为：（3）

所述定位损失仅计算正样本，代表网络预测的参数，代表真实边界框的参数，它们包含四个具体的参数，分别是框的中心点以及宽高的偏移因子，即、，所述定位损失的表达式为：（4）

式中，，，，，代表正样本总数，代表将特征图划分成单元格后的单元格左上角坐标，代表先验锚框的宽度和高度，CIOU的计算式如下：（5）

式中，IOU代表两框的交集面积与并集面积之比，gt代表真实框，代表预测框和真实框的中心点的欧式距离，代表能够同时包含预测框和真实框的最小闭包区域的对角线距离，，；

目标置信度是网络输出的预测框内存在目标的概率，采用二值交叉熵损失函数计算，所述置信度损失的表达式为：（6）

（7）

式中，代表第个预测边界框，{0，1}，等于1表示预测框内存在真实目标，等于0表示不存在真实目标，是网络输出的置信度值；

YOLOv3网络针对每个类别输出一个概率，计算损失时同样采取二值交叉熵损失函数计算且仅针对正样本计算，所述分类损失的表达式为：（8）

（9）

式中，代表第个预测边界框，Oij{0，1}，Oij等于1表示预测框内存在第类目标，等于0表示不存在真实目标，是网络输出的第类存在的概率。