欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2022108223568
申请人: 广州科语机器人有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-01-27
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于改进YOLOX模型的样本不均衡目标检测方法,其特征在于,所述改进YOLOX模型包括特征提取层、特征融合层和预测层;所述特征提取层包括多个带注意力机制的CSPDarkNet,所述改进YOLOX模型使用的损失函数为Varifocal损失函数和平衡损失函数,所述方法包括:获取扫地机器人视角图像数据集,所述图像数据集包括训练集和验证集;

将所述训练集输入待训练的改进YOLOX模型进行训练,通过所述验证集对改进YOLOX模型进行验证;

获取训练中改进YOLOX模型的Varifocal损失和平衡损失,并基于损失函数反向梯度传播更新模型参数直至模型收敛,得到训练后的改进YOLOX模型;

获取扫地机器人采集的待检测图像;

将所述待检测图像输入所述特征提取层进行处理,根据所述特征提取层的输出结果,得到多个第一特征;

将所述多个第一特征输入所述特征融合层进行跨层融合处理,得到多个预测特征;其中,所述跨层融合处理包括将所述多个第一特征融合处理后得到的中间特征中的部分或全部进行融合;

通过所述预测层处理所述多个预测特征,根据处理结果得到所述待检测图像的目标检测结果;

其中,通过以下公式获取所述平衡损失Loss:

其中,N为样本数量,Ii为第i张图片,WC为所设计的第C类的分类权重,Leiou为有效交并比损失,Lcls为分类损失,Lobj为Varifocal损失;

其中,通过以下公式获取第C类的分类权重WC:

其中,ni为第i类标签数量,nC为第C类标签数量,nclass为数据集类别数;

通过以下公式获取有效交并比损失Leiou:

其中,c表示能同时包含预测框和真实框的最小闭包对角线距离,cw、ch为两个矩形的闭包宽度和闭包高度,r为两个中心点的欧式距离,b、w、h分别为预测框的中心点、宽度和高度,bgt、wgt、hgt分别表示真实框的中心点、宽度和高度,IoU为交并比。

2.根据权利要求1所述的方法,其特征在于,包括:

通过以下公式获取所述Varifocal损失Lobj:

其中,p为Varifocal损失函数预测的IoU-aware分类得分,q为目标得分,正样本时q为交并比(IoU),负样本时q为0,g为调制因子,a为缩放因子。

3.根据权利要求1所述的方法,其特征在于,所述基于损失函数反向梯度传播更新模型参数,包括:通过如下算法获取训练中改进YOLOX模型的权重:

其中,Wt和Wt+1为第t次迭代和第t+1次迭代的权重,mW为反向传播算法的学习率,为损失函数对权重W的偏导数;

以及,通过如下算法获取训练中的改进YOLOX模型的偏移量:其中,bt和bt+1为第t次迭代和第t+1次迭代的偏移量,mb为反向传播算法的学习率,为损失函数对偏移量b的偏导数。

4.根据权利要求1所述的方法,其特征在于,包括:

通过指数移动平均方法更新所述模型参数,其中,指数移动平均方法通过如下公式实现:其中,WEMA,k、bEMA,k分别表示对第k轮训练后的权重和偏移量进行指数滑动平均更新后的参数值,a为衰减因子,为第k-1轮训练后的权重和偏移量。

5.根据权利要求1所述的方法,其特征在于,所述CSPDarkNet包括Focus模块和与所述Focus模块串联的多个Dark模块;

每个Dark模块后配有注意力机制模块,所述注意力机制模块的输入深度应为前置Dark模块的输出深度,所述注意力机制模块的输入深度输出深度与输入深度一致。

6.根据权利要求5所述的方法,其特征在于,包括:所述注意力机制模块后的嵌入位置配有检测头;所述检测头的数量根据待检测图像中的待检测目标尺寸大小确定。

7.根据权利要求1所述的方法,其特征在于,所述预测层包括Head层,用于在模型训练阶段计算损失,并在模型应用阶段处理所述多个预测特征,得到目标检测结果。