欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020116372917
申请人: 安徽工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于差分隐私的分组精准直方图数据发布方法,其特征在于,其步骤为:步骤一、获取数值型直方图统计数据字段,并将直方图频数输入到直方图数据集H=(H1,H2,…Hn)中,同时给定隐私保护预算ε和Δf,Δf为数据集H与其相邻数据集的L1距离;

*

步骤二、以第一个直方图桶H1为基桶Hi,将其加入有序直方图序列H中,并将该桶从H中删除;

步骤三、计算基桶Hi的近邻桶集合L(Hi)及指数机制打分函数u(Hi),根据打分函数u(Hi),以正比于 的概率,从L(Hi)选择出Hj,其中隐私预算ε1=ε/2,将Hj添加到有*

序直方图序列H,再将Hj作为基桶;

步骤四、重复步骤三,直到原始直方图数据集H为空;

*

步骤五、对有序直方图序列H 根据全局误差Err进行动态规划分组,选取全局误差最小G

的直方图分组结构H;

步骤六、用分组平均数描述分组的桶频数,向每个桶频数添加拉普拉斯噪音Lap(1/ε2),得到添加噪音后的直方图序列 并发布。

2.根据权利要求1所述的一种基于差分隐私的分组精准直方图数据发布方法,其特征在于:所述的步骤一中,每个Hi为单位区间的频数,隐私保护预算ε小于1。

3.根据权利要求2所述的一种基于差分隐私的分组精准直方图数据发布方法,其特征在于:所述的步骤三中,依据打分函数u(Hi)从基桶Hi的近邻桶集合L(Hi)中挑选出与基桶频数相近的桶,其中L(Hi)和u(Hi)分别根据式(1)和式(2)计算,L(Hi)={Hj:|Hj‑Hi|≤δ}                   (1)u(Hi)=‑(|Hj‑Hi|+|j‑i|)                  (2)其中,δ为控制近邻桶集合中桶数量的阈值。

4.根据权利要求3所述的一种基于差分隐私的分组精准直方图数据发布方法,其特征在于:所述的步骤五中,将动态规划的误差评价函数设为全局误差Err(*,Hl,Hr),如式(3)所示,

其中 表示该组的频数均值,|Gi|表示该组中桶个数。 为重构误差AE,为噪音误差;其中隐私预算ε2=ε/2,其决定向该组均值 添加的拉普拉斯噪音的大小,向 添加的拉普拉斯噪声的大小为Lap(1/ε2)/|Gi|。

5.根据权利要求4所述的一种基于差分隐私的分组精准直方图数据发布方法,其特征在于:所述的步骤五中,对直方图H*采用动态规划思想的分组,记录每种分组结构的最小全G

局误差 选出其中TErr最低的分组结构H ,并记录最优分组个数k,如公式(6)所示:

其中,n是直方图桶的个数,k是所有可能的分组数量,1≤k≤n。

6.根据权利要求5所述的一种基于差分隐私的分组精准直方图数据发布方法,其特征G

在于:所述的步骤六中,对分组后的直方图H中的每组桶频数取组均值,组Gi中直方图桶频数为: 后对每桶频数添加拉普拉斯噪音Lap(b),其中b=1/ε2,得到添加噪音后的直方图序列为 其中

7.根据权利要求6所述的一种基于差分隐私的分组精准直方图数据发布方法,其特征在于:所述的步骤六中,对原始数据集的加噪流程为构建服从拉普拉斯分布的概率密度函数,根据其概率密度函数求其逆累计分布函数,然后向该函数输入均匀分布的随机变量,即可得到拉普拉斯噪音。

8.根据权利要求7所述的一种基于差分隐私的分组精准直方图数据发布方法,其特征在于:获得拉普拉斯噪音的具体步骤为,S1、设定构建服从位置参数μ为0,尺度参数为b的拉普拉斯分布为Lap(b),则其概率密度函数p(x)如公式(7)所示,S2、将满足均匀分布的随机变量α~U(0,1)带入到拉普拉斯累计分布函数的逆函数中,则可以得到满足条件的噪音值如公式(8)所示,S3、取均匀分布α~U(‑0.5,0.5),将公式(8)的分段函数合并为公式(9),如下所示,‑1

F (x)=0‑b*sign(α)*ln(1‑2abs(α))         (9)其中,sign函数用来获取参数的正负,abs函数用来获取参数的绝对值。