1.一种密集场景中的多目标跟踪方法,其特征在于:包括:
步骤S1:获取第T帧图像,并对所述第T帧图像进行下采样,得到若干下采样特征图;
步骤S2:将所述若干下采样特征图进行上采样和特征融合,得到第一特征图,并通过卷积对所述第一特征图进行映射得到热力图检测结果,并基于所述热力图检测结果得到目标人物检测框;
同时对第T‑1帧图像中的目标人物在所述第T帧图像中的位置进行定位,得到定位结果;
步骤S3:将所述目标人物检测框和定位结果进行IOU匹配,若第T帧图像和第T‑1帧图像中所有目标人物均IOU匹配成功,则完成目标跟踪;若第T帧图像和第T‑1帧图像中存在目标人物IOU匹配未成功;执行步骤S4;
步骤S4:将所述步骤S1中的若干下采样特征图进行上采样,得到第二特征图,将所述第二特征图映射得到预设维度特征图,并对所述预设维度特征图进行降维,得到降维特征图;
步骤S5:将所述降维特征图在IOU匹配基础上进行二次匹配,具体为:将所述降维特征图与预存的第T‑1帧图像中的目标人物进行匹配,若第T帧图像和第T‑1帧图像中IOU匹配未成功的目标人物均二次匹配成功,则完成目标跟踪;若第T帧图像和第T‑1帧图像中IOU匹配未成功的目标人物二次匹配也未成功,则返回至步骤S2,直到所有目标人物均完成匹配。
2.根据权利要求1所述的密集场景中的多目标跟踪方法,其特征在于:所述步骤S1中的对所述第T帧图像进行下采样,得到若干下采样特征图的方法具体为:通过DLA编码器对所述第T帧图像进行下采样,得到若干下采样特征图,其中,所述DLA编码器包括若干根和若干类卷积块,所述根用于将类卷积块之间相互相加,所述类卷积块用于改变图像的通道数。
3.根据权利要求2所述的密集场景中的多目标跟踪方法,其特征在于:
所述类卷积块包括依次连接的卷积层、第一层归一化、深度可分离卷积层、第二层归一化、第一多层感知机、GeLU激活函数和第二多层感知机,并且所述5卷积层和第二多层感知机进行求和;
所述卷积层用于改变特征图的信道数;
所述第一层归一化和第二层归一化均用于防止过拟合,增加泛化性;
所述深度可分离卷积层用于减少参数数量,模拟自注意力操作;
所述第一多层感知机和第二多层感知机均用于弥补深度可分离卷积通道0间没有交互的问题。
4.根据权利要求1所述的密集场景中的多目标跟踪方法,其特征在于:
所述步骤S2中将所述若干下采样特征图进行上采样和特征融合,得到第一特征图,具体为:将所述若干下采样特征图进行上采样得到若干分辨率不同的上采样特征图,再将若干分辨率不同的上采样特征图进行特征融合,得到第5一特征图。
5.根据权利要求1所述的密集场景中的多目标跟踪方法,其特征在于:
所述步骤S2中对第T‑1帧图像中的目标人物在所述第T帧图像中的位置进行定位,具体为:通过卡尔曼滤波对第T‑1帧图像中的目标人物在所述第T帧图像中的位置进行定位。
6.根据权利要求1所述的密集场景中的多目标跟踪方法,其特征在于:所述步骤S4中将所述预设维度特征图进行降维,得到降维特征图,具体为:将所述预设维度特征图的长和宽合成一个维度,得到降维特征图。
7.根据权利要求1所述的密集场景中的多目标跟踪方法,其特征在于:
所述步骤S5中将所述降维特征图在IOU匹配基础上进行二次匹配,具体为:将所述降维特征图在IOU匹配基础上进行匈牙利匹配,所述匈牙利匹配通过计算目标人物之间的余弦距离来实现,若目标人物之间的余弦距离小于预设阈值,则表明目标人物匹配成功;若目标人物之间的余弦距离大于预设阈值,则表明目标人物匹配未成功。
8.一种密集场景中的多目标跟踪系统,其特征在于:包括:
下采样模块:用于获取第T帧图像,并对所述第T帧图像进行下采样,得到若干下采样特征图;
特征生成与定位模块:用于将所述若干下采样特征图进行上采样和特征融合,得到第一特征图,并通过卷积对所述第一特征图进行映射得到热力图检测结果,并基于所述热力图检测结果得到目标人物检测框;
同时用于对第T‑1帧图像中的目标人物在所述第T帧图像中的位置进行定位,得到定位结果;
第一匹配模块:用于将所述目标人物检测框和定位结果进行IOU匹配,若第T帧图像和第T‑1帧图像中所有目标人物均IOU匹配成功,则完成目标跟踪;若第T帧图像和第T‑1帧图像中存在目标人物IOU匹配未成功;执行特征生成模块的过程;
特征生成模块:用于将所述若干下采样特征图进行上采样,得到第二特征图,将所述第二特征图映射得到预设维度特征图,并将所述预设维度特征图进行降维,得到降维特征图;
第二匹配模块:用于将所述降维特征图在IOU匹配基础上进行二次匹配,具体为:将所述降维特征图与预存的第T‑1帧图像中的目标人物进行匹配,若第T帧图像和第T‑1帧图像中IOU匹配未成功的目标人物均二次匹配成功,则完成目标跟踪;若第T帧图像和第T‑1帧图像中IOU匹配未成功的目标人物二次匹配也未成功,则返回至特征生成与定位模块的执行过程,直到所有目标人物均完成匹配。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述密集场景中的多目标跟踪方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述密集场景中的多目标跟踪方法的步骤。