1.一种基于逻辑回归算法的煤矿配电网络停电事故预测方法,其包括如下步骤:步骤S1、通过煤矿配电网络的SCADA系统收集多个电力设备的工作电流,工作电压、工作时长及其停电记录信息;
步骤S2、搭建Hadoop集群并录入步骤S1中收集的数据,录入的数据内容包括每个电力设备的设备名称以及相对应的工作时长、工作电压、工作电流和停电记录,且每次录入的数据以单个电力设备进行归类;
步骤S3、搭建Spark集群,对步骤S2中的数据进行提取和预处理,并生成数据矩阵集合;
步骤S4、根据步骤S3中获取的数据矩阵集合,针对每个电力设备均构建逻辑回归模型;
步骤S5、将步骤S1中获取的最新数据代入步骤S4中构建的逻辑回归模型中,对每个电力设备的停电概率进行预测;
步骤S3中的数据预处理包括数据清洗,数据清洗包括对明显异常数据、工作时长数据、工作电压数据和工作电流数据的处理;
对工作电压数据(v1v2v3v4...vn)和工作电流数据(i1i2i3i4...in)的处理包括如下步骤,步骤S31、计算工作电压数据和工作电流数据的算术平均值 其中X表示电压或电流;
步骤S32、计算工作电压数据和工作电流数据的剩余误差VI,步骤S33、根据贝塞尔法计算工作电压数据和工作电流数据的均方根偏差o,步骤S34、若任一工作电压数据满足 则Vi为粗大误差数据,将被舍弃,若任一工作电压数据满足 则Vi为正常误差内数据,将被保留;若任一工作电流数据满足 则Ii为粗大误差数据,将被舍弃,若任一工作电流数据满足则Ii为正常误差内数据,将被保留;
步骤S4中,构建逻辑回归模型具体包括如下步骤,
步骤S41、将步骤3中获取的对应电力设备的数据矩阵集合的70%的数据作为训练集,训练集用于注入逻辑回归算法中生成对应电力设备的逻辑回归模型;剩余30%的数据作为数据集,数据集用于测试所生成模型的质量;
步骤S4 2、根 据Sigm oid 函数,定 义逻辑回 归模型的预 测函数 为T
其中θ 为条件概率的参数矩阵,x为一组工作时长、工作电压、工作电流和停电记录的数据矩阵;
步骤S43、根据预测结果是一个二分类结果,这里将预测函数进行整合得到样本函数,y 1‑y样本函数为P(Y|X;θ)=(hθ(x)) (1‑hθ)) ;
步骤S44、根据逻辑回归的极大似然估计法来进行参数矩阵的获取,将得到的样本函数相乘得到似然函数 将似然函数转化为对数似然函数步骤S45、将步骤S41中获取的训练集代入对数似然函数中,计算对数似然函数的最大值,最大值表示的最大的概率,再通过使用梯度下降算法,来计算误差的最小值;对对数似然函数进行求解,通过对数似然函数求偏导得到更新方向进而获取更新函数为 其中,通过梯度下降方法定义误差
为预测值和真实值的差值,通过迭代完成对参数矩阵的更新,进而获取逻辑回归模型最优的参数;
步骤S46、采用K折验证法获取最优逻辑回归模型。
2.根据权利要求1所述的一种基于逻辑回归算法的煤矿配电网络停电事故预测方法,其特征在于:步骤S1中所述的多个电力设备包括输电线路、柱上配电变压器、发电设备、断路器、负荷开关、熔断器、隔离开关、重合器、分段器、开关站、环网单元、箱变和电缆分接箱中的一个或多个。
3.根据权利要求1所述的一种基于逻辑回归算法的煤矿配电网络停电事故预测方法,其特征在于:对明显异常数据的处理,包括通过莱茵达准则将明显异常数据剔除。
4.根据权利要求1所述的一种基于逻辑回归算法的煤矿配电网络停电事故预测方法,其特征在于:对工作时长数据的处理,包括以对应电力设备最后一次维护时间作为开始时间进行计算工作时长。
5.根据权利要求1所述的一种基于逻辑回归算法的煤矿配电网络停电事故预测方法,其特征在于:步骤S46中,通过将数据集数据分成K份,循环K轮得到数据模型,每次剩余的1份用于验证模型质量,以最佳质量的模型作为最优模型。