1.基于本地差分隐私的数据流直方图发布方法,其特征在于,具体按照以下步骤实施:步骤1、给定长度为T的数据流D,服务器设置并初始化滑动窗口wi,其中i为滑动窗口的时间戳标识符,初次发送滑动窗口,即i=1,此外滑动窗口的属性还包括时间戳间隔单位大小和滑动窗口大小,这两个属性在算法发布直方图的过程中保持不变;
所述步骤1具体按照以下步骤实施:
发布第一个直方图H1时,服务器首先发送滑动窗口wi的属性数据之后位于滑动窗口内的用户将数据dij在本地添加随机扰动噪声,得到 并发送给服务器,服务器端接收到来自时间戳1的数据 其中 此时滑动窗口真实长度为|w1|=1;
对于初始时间戳的用户来说此次用于扰动数据的隐私预算为∈′=∈/|wi|,其中|wi|为服务器预设值,∈是总隐私预算,滑动窗口的真实长度随新的时间戳到来慢慢增长,直到增长到服务器预设值|wi|;并且,滑动窗口的大小|wi|在之后直方图发布的过程中保持不变;
步骤2、滑动窗口wi一个时间单位,服务器端将滑动窗口的属性数据发送到用户端,用户收到滑动窗口wi的属性数据之后,判断本地数据的时间戳是否在当前滑动窗口内,若是,则计算需要分配在每个时间戳上的隐私预算,将本地数据dij使用k‑RR扰动机制得到扰动后的数据 并将 发送到服务器端;
所述步骤2具体按照以下步骤实施:
步骤2.1、滑动窗口wi到达时,用户j判断自己的时间戳的位置,若是首次进入滑动窗口wi中,则同样需要计算每次需要消耗的隐私预算∈′=∈/|wi|,并且在之后的(wi‑1)个时间戳内,直接使用∈′作为扰动机制需要消耗的隐私预算,若时间戳的位置位于滑动窗口wi外,则判定为失效数据,不进行任何操作;
步骤2.2、位于当前滑动窗口wi内的用户使用k‑RR随机响应机制扰动数据,k‑RR随机响应机制满足以下公式:其中,P(R′|R)表示输入值为R且输出值为R′的概率,本发明中用户输入数据为dij,输出的数据为 ∈为隐私预算,K为输入数据R的取值范围大小,k‑RR随机响应机制输入的数据值与扰动输出的数据值相等的概率为 输出任意其他的数据值的概率为用户将扰动后的数据值与相对应的隐私预算值打包发送给服务器;
步骤2.3、时间戳位于滑动窗口wi内的用户都执行步骤2.2;
步骤3、服务器收到不同用户发送的数据集 其中 是由步骤2中用户的发送数据组成,既 并统计 的不同取值的频数 其中 k是用户数据 不同值的序号,之后对 进行无偏估计,得到sum′ik,其中sum′ik是对 的无偏估计,根据 绘制直方图并发布;
步骤4、滑动窗口wi每滑动一个时间单位,则执行一次步骤2和步骤3,服务器不停绘制直方图并实时发布,直到滑动窗口到达数据流末尾,则所有直方图绘制发布流程结束。
2.根据权利要求1所述的基于本地差分隐私的数据流直方图发布方法,其特征在于,所述步骤3具体按照以下步骤实施:步骤3.1、服务器端得到用户发送的数据集 其中 统计不同用户数据
取值的频数 其中k是用户数据 不同值的序号;
步骤3.2、估计不同特征值的频数 其中第k个特征值的频数为 根据以下
公式估计得到 的无偏估计值为sum′ik,
其中,sum′ik是原始频数sumik的无偏估计值,K为输入的用户数据dij的取值范围大小,n为用户个数;
步骤3.3、服务器根据sum′ik,绘制直方图,其中直方图的横坐标表示用户数据的不同取值,纵坐标表示不同用户数据取值的频数sum′ik,并发布。
3.根据权利要求2所述的基于本地差分隐私的数据流直方图发布方法,其特征在于,所述步骤4具体按照以下步骤实施:滑动窗口wi发布当前窗口内数据的直方图之后,会随着新的时间戳到来向前滑动一个时间单位,既i=i+1,与步骤1中方法相同,再次向用户端发布滑动窗口属性数据,时间戳位于滑动窗口内的用户端执行步骤2,服务器执行步骤3,二者交替重复执行,服务器不停绘制直方图并实时发布,直到滑动窗口到达数据流末尾,则所有直方图绘制发布流程结束。