欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020110459921
申请人: 安徽工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于滑动窗口的数据流差分隐私直方图发布方法,其特征在于,包括以下步骤:

1)确定待发布直方图的区间;

2)对待发布直方图中任一区间,对当前进入滑动窗口数据流的数据采用近似查询统计的方法获得符合同一区间的近似统计频数,过滤近似统计频数小于0的区间后,根据各区间的近似统计频数构建当前时刻近似统计直方图;

3)采用相似性度量的方法,计算当前时刻和前一时刻构建的两个近似统计直方图之间的相关距离T;

4)判断相关距离T与给定相关距离阈值T1大小关系:

若相关距离T小于或等于阈值T1,使用前一时刻加噪直方图替代当前时刻近似统计直方图,获得当前时刻加噪直方图;

若相关距离T大于阈值T1,采用满足差分隐私的贪婪聚类算法对当前时刻近似统计直方图分配隐私参数进行加噪,获得当前时刻加噪直方图;

5)发布当前时刻加噪直方图。

2.根据权利要求1所述的基于滑动窗口的数据流差分隐私直方图发布方法,其特征在于,所述步骤2)中同一区间近似统计频数的计算过程为:定义滑动窗口的大小为W,输入滑动窗口的数据流为D,基于数据分块思想,将滑动窗口划分为k个子块、子块的大小为W/k,k个位的数组b,数据流第一次进入的第一个子块的偏移量m,1的计数器y;

判断进入滑动窗口数据流的当前数据是否符合所判断统计的区间;若符合,当前数据置为1;不符合,当前数据置为0;

检查当前数据进入子块中的位置:若当前数据不在子块的末尾位置,则子块内偏移量m增加1,计数器y的值增加1;若当前数据在子块的末尾位置,则下一数据进入下一子块,子块内偏移量m重新记为0,并且当计数器y的值增加1后超过子块的大小时,自计数器y的值中减去子块的大小后重新计数,同时数组b中与计数器y的值超过子块的大小次数对应位置的位数记为1;

依次对滑动窗口数据流内的所有数据进行近似查询统计,则同一区间近似统计频数为其中,B为数组b中位数为1的统计量,m×bt为当前滑动窗口的过期数据,t表示数组b中位置的索引,W/2k为区间的近似统计频数与真实频数的误差。

3.根据权利要求1所述的基于滑动窗口的数据流差分隐私直方图发布方法,其特征在于,所述步骤4)中当相关距离T大于阈值T1时当前时刻加噪直方图的获得过程为:对当前时刻近似统计直方图所有区间的近似统计频数进行排序,使得近似统计频数相近的区间排在一起;使用满足差分隐私的贪心聚类算法对排序后的近似统计直方图各区间进行预分组;用预分组中每个分组内近似统计频数平均值取代在该分组内所有区间的近似统计频数,并利用每个分组内中区间个数,为每一区间动态分配隐私参数进行加噪,获得当前时刻加噪直方图。

4.根据权利要求1所述的基于滑动窗口的数据流差分隐私直方图发布方法,其特征在于,所述子块数量k的取值使得当前时刻近似统计直方图中任一区间的近似统计频数与真实频数之间的总误差不超过W/2k。

5.根据权利要求3所述的基于滑动窗口的数据流差分隐私直方图发布方法,其特征在于,所述贪心聚类算法对排序后近似统计直方图各区间预分组的过程为:排序后近似统计直方图的第一个区间自成一组,判断第二个区间加入当前分组后引入的噪音误差与以第二个区间为起点重新建立的新分组引入的噪音误差的大小;若加入当前分组比建立一个新分组引入的噪音误差更小,则加入当前分组,否则建立一个新分组。

6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-5任一项所述的基于滑动窗口的数据流差分隐私直方图发布方法。