1.一种无线传感器网络半监督在线异常检测方法,其特征在于,所述方法包括:S1获取待检测的无标记的传感器网络数据,构成无标注数据集;
S2利用预训练好的时空特征提取模型获取无标注数据集中的数据的分类标签Yclstm,所述时空特征提取模型包含用于提取数据的空间特征的CNN模型和用于提取数据的时间特征的LSTM模型;同时利用K‑means获取无标注数据集中的数据对应K‑means的分类标签YK‑means;
S3根据S2得出的分类标签Yclstm和分类标签YK‑means判断是否更新预训练好的时空特征提取模型;
S4若S3的判断结果为无需更新,则直接输出分类标签Yclstm作为待检测的无标注的传感器网络数据的分类结果;
S5若S3的判断结果为需要更新,则生成新的训练数据训练时空特征提取模型中的LSTM模型,不断迭代至获取到的分类标签Yclstm与分类标签YK‑means的分类误差小于预定阈值或迭代次数超过预定次数;输出此时得到的分类标签Yclstm,作为待检测的无标注的传感器网络数据的分类结果;
所述S2中利用K‑means获取无标注数据集中的数据对应K‑means的分类标签YK‑means,包括:将无标注数据集中的数据聚类为4个簇C={c1,c2,c3,c4},并获取其四个聚类中心CenterP={cp1,cp2,cp3,cp4};
将4个簇中数据量最少的簇ci设置为异常簇,其余簇设置为正常簇;若存在多个数据量最小的簇,则计算各聚类中心到其余簇聚类中心的合向量的模VectorMod={vm1,vm2,vm3,vm4},并将所有数据量最小的簇中合向量的模最大的簇设置为异常簇,其余簇设置为正常簇,由此得到新的簇的集合{CP,CN},其中CP为异常簇,CN为正常簇,由此获得K‑means的分类标签YK‑means。
2.根据权利要求1所述的方法,其特征在于,所述S2中利用预训练好的时空特征提取模型获取无标记数据集中的数据的分类标签Yclstm包括:使用卷积神经网络CNN模型提取数据的空间特征;
将提取出的空间特征输入长短时记忆网络LSTM模型的LSTM层提取相应的时间特征;
将提取出的时间特征和空间特征输入长短时记忆网络的全连接层,对数据进行分类,得到分类标签Yclstm。
3.根据权利要求2所述的方法,其特征在于,各聚类中心到其余聚类中心的合向量的模vmi定义为:其中cpi和cpj表示两个不同的聚类中心。
4.根据权利要求3所述的方法,其特征在于,所述S3根据S2得出的分类标签Yclstm和分类标签YK‑means判断是否更新预训练好的时空特征提取模型,包括:根据下式计算分类标签Yclstm和分类标签YK‑means的分类误差ε;
其中Ws为分类标签的数量。
5.根据权利要求4所述的方法,其特征在于,所述S5包括:
S51依据分类标签Yclstm和分类标签YK‑means获取新的有标注数据集;
S52将分类所得标签Yclstm与YK‑means相同部分对应的数据作为可信数据,并对其进行标注,其余作为不可信数据;
S53利用K‑means算法对不可信数据以k=2进行再次聚类,并将聚类所得簇中,数据量少的认定为异常簇,数据量多的认定为正常簇,并对其进行标注;
S54将步骤53中标注好的数据依据数据的时间戳合并,作为新的有标注数据集;
S55将步骤54得到的新的有标注数据集中的数据输入CNN模型提取对应的空间特征,并将提取到的空间特征作为LSTM网络的输入;
S56利用反向传播不断更新LSTM网络的参数,直到LSTM网络的输出经全连接层以及Softmax分类器得到的分类结果同原始有标注数据误差小于分类误差的预定阈值时,结束迭代;若迭代次数超过20次,结束迭代;
S57输出此时得到的分类标签Yclstm,作为待检测的无标注的传感器网络数据的分类结果。
6.根据权利要求5所述的方法,其特征在于,所述S1中预训练好的时空特征提取模型的训练过程为:预采集传感器网络数据流数据,并对数据进行标注,将预采集到的数据中数值符合规律的数据,标注为正常数据,标签为0;将数值突变、与正常数据变化趋势不同的数据,标注为异常数据,标签为1,得到用于训练时空特征提取模型的有标注数据集;所述传感器网络数据流数据为待检测的无线传感器网络;
利用有标注的数据集对时空特征提取模型进行预训练,获取预训练模型,即预训练好的时空特征提取模型。
7.根据权利要求6所述的方法,其特征在于,所述获取预训练模型,包括:使用卷积神经网络提取有标注数据集中的数据的空间特征;
将提取出的空间特征输入长短时记忆网络中的LSTM层提取相应的时间特征;
将提取出的时间特征和空间特征输入长短时记忆网络的全连接层,对数据进行分类;
利用反向传播更新预训练模型的模型参数,得到预训练模型,即预训练好的时空特征提取模型。
8.根据权利要求7所述的方法,其特征在于,利用反向传播更新预训练模型的模型参数,得到预训练模型,包括:利用平均交叉熵作为预训练模型的损失函数;
利用实际标签y与预测标签y′计算交叉熵Hy′(y):
其中y′b为预测标签y′中第b个标签,yb为实际标签y中第b个标签;
损失函数为:loss=Hy′(y)/N,其中Ny为实际标签y中标签的数量,Ny′为预测标签y′中标签的数量,并且Ny=Ny′;反向传播利用梯度下降的方式拟合时空特征提取模型的参数,目标是最小化损失函数,得到待检测的传感器网络数据对应的时空特征提取模型的模型参数。
9.一种基于无线传感器网络的环境监测方法,其特征在于,所述方法采用权利要求1‑8任一所述的无线传感器网络半监督在线异常检测方法对传感器采集到的数据进行异常检测,根据异常检测结果判断环境监测结果;所述传感器采集到的数据包括环境温度、湿度、光照强度及传感器电压。