1.基于多种目标融合与时空视频序列的手机检测方法,其特征在于:所述手机检测方法包括:对改进的yolo模型进行训练得到检测模型,并输入视频图像帧运行检测模型得到第一帧预测值;
对所述第一帧预测值进行解码,去掉score值低于预设值的框并以Diou阈值实现NMS,并根据某帧图像的解码结果在只出现手机框时,对手机框进行抑制;
将抑制后的结果作为目标模板,输入视频图像帧作为候选框搜索区域,将二者同时输入到全连接孪生网络,并选择score map相似度最大的结果对视频图像帧中的手机进行画框标记;
如果已跟踪设定帧数,则重复上述步骤直到视频图像输入结束。
2.根据权利要求1所述的基于多种目标融合与时空视频序列的手机检测方法,其特征在于:所述手机检测方法还包括如果没有设定帧数,则重复将抑制后的结果作为目标模板,输入视频图像帧作为候选框搜索区域,将二者同时输入到全连接孪生网络,并选择score map相似度最大的结果对视频图像帧中的手机进行画框标记的步骤。
3.根据权利要求1所述的基于多种目标融合与时空视频序列的手机检测方法,其特征在于:所述手机检测方法还包括在对执行改进的yolov3模型进行训练得到检测模型,并输入视频图像帧运行检测模型得到第一帧预测值步骤之前需要执行获取训练集和测试集的步骤。
4.根据权利要求3所述的基于多种目标融合与时空视频序列的手机检测方法,其特征在于:所述获取训练集合测试集的步骤包括:对录制视频进行分帧处理并对处理后的视频图片进行标注,隔帧提取部分图片构建数据集,将数据集按照一定比例划分为训练集和测试集。
5.根据权利要求1所述的基于多种目标融合与时空视频序列的手机检测方法,其特征在于:所述对所述第一帧预测值进行解码,去掉score值低于预设值的框并以Diou阈值实现NMS,并根据某帧图像的解码结果在只出现手机框时,对手机框进行抑制包括:根据解码公式bx=sigmoid(tx)+cx、by=sigmoid(ty)+cy、bw=pwetw、bh=pheth、conf=sigmoid(raw_conf)和prob=sigmoid(raw_prob)对所述第一帧预测值进行解码;
以0.4的score阈值去掉置信度或者类别概率不满足要求的框并以0.1的Diou阈值实现NMS;
针对某帧图像的解码结果,若出现手机框而未出现人体框或者手部框或者摄像头框的情况时,并剔相应图像中关于手机的预测框,从而对手机框进行抑制。
6.根据权利要求1所述的基于多种目标融合与时空视频序列的手机检测方法,其特征在于:对yolo模型的改进包括以下内容:对yolov3-tiny增加检测细小物体的s分支,以改善对摄像头等小物体的检测效果;
在上一步模型结构的基础上,增加SPP、SAM、CAM模块与残差连接,改善特征提取能力。