1.基于自编码器的数据安全去重方法,其特征是:该方法由以下步骤实现:步骤一、用户构建自编码器模型,并采用数据对所述自编码器模型训练,获得训练好的模型;步骤二、用户采用训练好的模型的编码器部分为新数据m生成摘要标签t1(m),所述摘要标签即位于所述训练好的模型中部的隐含层值,并将训练好的模型的隐含层激活函数替换为非单调函数;步骤三、用户为新数据m生成指纹标签t2(m),t2(m)=(ga,ga·h(m));式中,g为循环群的生成元,作为公共参数,所有用户以及云存储均使用相同的g;a为随机数;h(m)是数据的哈希值;步骤四、用户将所述摘要标签t1(m)和指纹标签t2(m)组合成数据标签t(m),t(m)=(t1(m) ,t2(m)),上传到云存储;步骤五、云存储遍历标签库中的所有数据标签,设定所有标签组成的集合为S,S中的元素为t(mj),t(mj)=(t1(mj) ,t2(mj)),其中j为元素下标且满足0≤j<|S|;对所有的mj,计算t1(mj)与t1(m)之间的欧式距离,并按照距离从小到大对标签排序,生成有序的标签集合So;步骤六、设置比例因子r,满足0
生成t2(mk)时选择的随机数;交换gb和t2(m)中的ga,分别计算和e(gb ,ga
·h(m)),若值相同,则mk=m,即用户新上传的数据在云存储中存在,则云存储通知用户不必上
传新的数据,若值不相同,则用户新上传的数据在云存储中不存在,云存储通知用户上传新数据m,并将数据标签t(m)加入标签库。