1.一种基于迁移学习-角点预测的图注意目标跟踪方法,其特征在于,包括以下步骤:预训练GoogLeNet网络;预处理训练集数据集:冻结特征层参数:将GoogLeNet的卷积层和池化层参数固定,使其不会发生梯度的更新,以优化全连接层;将经过GoogLeNet网络的特征,通过图注意模块GAM,进行图注意信息嵌入;经过图注意信息嵌入的特征序列作为新的特征映射,被送入到全卷积网络FCN,并分别为对象边界框的左上角和右下角输出两个概率图Ptl(x,y)和Pbr(x,y);通过计算角点概率分布的期望值,得到预测框坐标;利用随机梯度求解损失函数,对全连接层的参数进行升级优化,微调权重参、偏置参数;进行目标跟踪:用新的视频作为网络输入,用角点预测计算分类回归的位置并框出目标;
所述图注意模块GAM进行图注意信息嵌入的步骤具体包括:
图注意模块GAM指的是将输入的特征向量通过初始化矩阵W(W∈RF'×F)对顶点h特征进行增维,然后只计算节点i的相邻的节点j,最后,通过a映射:RF‘×RF→R,把拼接后的高维特征映射到一个实数上,使用softmax进行正则化处理,得到注意力系数;通过这样的方式完成一个完整的二部图在目标模块和搜索区域之间建立部分到部分的对应关系,实现了有效的信息嵌入;
所述为对象边界框的左上角和右下角输出两个概率图Ptl(x,y)和Pbr(x,y),具体包括:将步骤4得到的特征映射送入到一个简单的全卷积网络FCN,FCN由L个堆叠的Conv-BN-ReLU层组成,得到左上角概率图Ptl(x,y)和右下角概率图Pbr(x,y);
所述通过计算角点概率分布的期望值,得到预测框坐标,具体公式为:
其中:(xtl,ytl)表示预测框的左上角坐标,(xbr,ybr)预测框的右下角坐标;H、W分别表示预测框的宽、高;x、y分别表示预测框的各个点坐标。
2.根据权利要求1所述的一种基于迁移学习-角点预测的图注意目标跟踪方法,其特征在于,所述预训练GoogLeNet网络,具体包括:将GOT-10k数据集作为训练数据集,训练GoogLeNet,使GoogLeNet具有初始值,GoogLeNet的核心思想是将稀疏矩阵聚类为较为密集的子矩阵来提高计算性能,通过不垂直堆砌层的方法得到更深的网络,使GoogLeNet网络具备图像特征提取的能力。
3.根据权利要求2所述的一种基于迁移学习-角点预测的图注意目标跟踪方法,其特征在于,所述步骤2预处理训练集数据集,具体包括:将训练数据集中的所有图像进行随机剪裁,得到一组尺寸为287*287的训练数据集,将剪裁后得到的训练数据集顺序打乱,从中抽取相同和不同类别的图像,组成新的训练数据集。
4.根据权利要求3所述的一种基于迁移学习-角点预测的图注意目标跟踪方法,其特征在于,还包括对新的数据集采用缩放变形、平移变换、颜色增强在内的数据增广方法以增强模型的学习能力。
5.根据权利要求1所述的一种基于迁移学习-角点预测的图注意目标跟踪方法,其特征在于,所述利用随机梯度先发求解损失函数,对全连接层的参数进行升级优化,微调权重参、偏置参数,用l1Loss和IoULoss相结合的损失函数,可表示为:其中:yi表示真实框的值,表示预测框的值;λiou和表示超参数。