1.一种基于深度学习的隐私增强数据处理方法,用于对车辆节点上传的感知数据进行数据分析和预处理,其特征在于,包括如下步骤:
1)使用基于均值哈希的图像指纹计算法,剔除感知数据中的相似数据,具体的使用基于均值哈希的图像指纹计算法将图像进行压缩,再确定一条基准线使图像指纹计算法的结果转换为二值结果,将相似度超过基准线的图像记录为相似,否则记录为不相似,剔除相似的图像;
2)对带标签的数据集和无标签数据集进行数据增强,采用增强后的数据训练并测试基于半监督学习的分类模型,所述数据增强具体包括如下:有标签的数据集X={(xa,ga);a∈(1,2,3…A)}和无标签的数据集V={va;a∈(1,2,3…A)},A为数据集中样本的个数,为数据增强轮次,H为锐化参数,θ为NDH中的参数,xa、va指X和V中的样本,ga为标签;
对X中的每一个单个样本xa做一次数据强化,得到
然后对V中的每一个单个样本va分别进行K轮数据强化,得到
通过加强后的有标签的数据集X输入基于监督学习的分类模型进行训练,将加强后的无标签的数据集V对训练好的基于监督学习的分类模型进行测试;
3)将步骤1)得到的数据输入训练好的半监督学习的分类模型进行标签猜测,该标签包括图像相关和图像不相关,剔除标签为图像不相关的数据;
对一个无标签样本进行K轮数据增强,会产生K个客观标签值相同的不同样本,使用现有模型对其进行标签判断,然后再对K个结果取平均值,即有:其中, 为对无标签样本va中K个客观标签值相同的不同样本进行标签猜测的平均值,gmodel(z|va,k;ω)是已有模型根据类标签z,第a个无标签样本的第k个数据增强样本va,k以及参数ω所产生的分布,即标签猜测的结果;
为了避免标签猜测的结果分布的过于均匀,引入锐化算法来降低 分布的熵,即有:其中,g为输入分布,H为一个超参数,u表示当前进行标签集合中的第u个标签的锐化,N表示标签集合的元素个数,要进行锐化处理的分布是 在使用时是将 代入g;
至此,得到对于单个无标签样本va的标签猜测:
ma=Sharpen(g,H)。
2.一种基于深度学习的隐私增强数据处理的车联网系统,其特征在于:包括车辆节点、边缘层和云端;该车辆节点用于收集道路的感知数据并上传至边缘层;边缘层采用权利要求1所述的一种基于深度学习的隐私增强数据处理方法,并将筛选后的数据上传至云端。