1.一种基于孪生网络的视觉目标跟踪方法,其特征在于,包括:分别输入作为跟踪目标的模板图像及作为搜索范围的检测图像;采用残差网络分别提取所述模板图像的特征和所述检测图像的特征,将提取的特征输入到建立的模型预测器,得到目标样本的背景信息;将得到的目标样本的背景信息与当前帧的池化结果进行对比,最后生成目标框。
2.根据权利要求1所述的基于孪生网络的视觉目标跟踪方法,其特征在于,所述分别输入作为跟踪目标的模板图像及作为搜索范围的检测图像,包括:步骤1、参数初始化,在初始零时刻,初始化目标的位置并将初始帧作为测试帧;步骤2、输入下一帧图像并定义下一帧图像为当前帧图像。
3.根据权利要求2所述的基于孪生网络的视觉目标跟踪方法,其特征在于,所述采用残差网络分别提取所述模板图像的特征和所述检测图像的特征,将提取的特征输入到建立的模型预测器,得到目标样本的背景信息,包括:步骤3、根据测试帧与当前帧图像构建两个分支并将这两个分支异步加入到ResNet模块进行特征提取;步骤4、在残差网络提取过程中,将提取的特征运用卷积模块,进行池化;步骤5、对步骤4中特征映射输入到模型预测器,得到初始模型;步骤6、运用循环优化模块算法对步骤5的特征进行模型优化学习,得到最终的识别模型。
4.根据权利要求3所述的基于孪生网络的视觉目标跟踪方法,其特征在于,所述将得到的目标样本的背景信息与当前帧的池化结果进行对比,最后生成目标框,包括:步骤7、运用步骤6产生的最终模型与当前帧的池化结果进行卷积运算;步骤8、对步骤7得出的结果进行判别损失学习,学习结果返回到步骤6,并且对测试帧中的目标框随机生成得分与判别学习后的结果进行置信分析,生成新的目标框;步骤9、返回步骤2判断是否为最后一帧图像,若不是继续执行,若是就结束。
5.根据权利要求4所述的基于孪生网络的视觉目标跟踪方法,其特征在于,所述模型预测器的结构具体包括:初始化模块和模型优化模块;模型预测器为减少模型预测时所需的优化递推次数,引入网络模块,减少学习参数,训练模型预测器来准确的预测下一帧目标的方位信息;模型预测器的初始化模块由一个卷积层和一个精确感兴趣池组成,从目标区域根据残差网络提取感兴趣池中的特征,并将提取的特征合并成模型相同的大小,对所有样本在训练集中取平均值,得到初始模型;在模型预测器的模型优化模块中,分别处理来自模型初始化的初始模型特征、主干网络直接提取的特征以及模型优化出的反馈特征,得到最终的识别模型。
6.一种基于孪生网络的视觉目标跟踪装置,其特征在于,包括:第一主模块,用于分别输入作为跟踪目标的模板图像及作为搜索范围的检测图像;第二主模块,用于采用残差网络分别提取所述模板图像的特征和所述检测图像的特征,将提取的特征输入到建立的模型预测器,得到目标样本的背景信息;第三主模块,用于将得到的目标样本的背景信息与当前帧的池化结果进行对比,最后生成目标框。
7.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器和通信接口;其中,
所述处理器、存储器和通信接口相互间进行通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以执行权利要求1至5任一项权利要求所述的方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行权利要求1至5中任一项权利要求所述的方法。