1.一种基于数据挖掘的企业用电量分析与预测方法,其特征在于:包括以下步骤:S1:对企业用电量数据集进行预处理;
S2:利用聚类算法对数据预处理后的企业用电量数据集进行聚类;
S3:判断是否存在异常数据,若存在异常数据则对其进行修正处理;
S4:数据修正后,选取企业用电量样本集中时间序列的前80%数据为训练集,后20%数据为测试集;
S5:构建循环神经网络模型预测企业用电量;
S6:检验模型,若不满足要求,则返回步骤S2,对数据集重新聚类,以此反复,直到预测结果满足要求为止。
2.根据权利要求1所述的基于数据挖掘的企业用电量分析与预测方法,其特征在于:在所述步骤S1中包括以下步骤:S11:判断数据集是否有缺失值,若有,执行步骤S12,若没有,执行步骤S13;
S12:数据缺失值处理:利用牛顿差值法对数据缺失值进行填补,即利用企业在一段时间内的已知用电量做出特定函数,用所述特定函数获得这段时间内的数据缺失点,作为企业用电量的近似值;执行步骤S13;
S13:数据归一化处理:不同的数据量纲对数据分类结果会产生不同的影响,按照以下公式将数据归一化到[0,1]区间:y=(x-xmin)/(xmax-xmin)
其中,x为一条数据特征的原始值,xmin和xmax分别为该数据中的最小值和最大值,y为每条数据进行归一化处理以后的数据值;
S14:数据维度约简处理:利用PAA算法对企业用电量时间序列样本进行维度约简。
3.根据权利要求1所述的基于数据挖掘的企业用电量分析与预测方法,其特征在于:在所述步骤S2中,采用谱聚类算法结合影响因素对企业用电量进行聚类,所述影响因素包括温度、湿度和节假日;利用动态时间归整算法构造样本数据集的相似度矩阵w,求出对应的拉普拉斯矩阵L,计算L的特征值与特征向量,最后选择一个或多个特征向量对不同的数据点进行聚类。
4.根据权利要求1所述的基于数据挖掘的企业用电量分析与预测方法,其特征在于:在所述步骤S3中,利用聚类得出的各类数据特征曲线对数据集中的异常数据检测与修正:首先求出每类数据对应于各日期的企业用电量方差;然后利用方差逐步判断各类曲线中是否存在异常数据;
若存在异常数据,根据以下公式进行修正:
其中r为该类数据样本间的最大距离,x(i,p)为p时刻异常点对应的值,E(i,p)为p时刻特征曲线对应的值,x(i,p)'为修正后的异常数据值;
待所有数据检测与修正完后,利用谱聚类算法对修正曲线重新聚类;若不存在异常数据,直接进入企业用电量预测模型的搭建。
5.根据权利要求1所述的基于数据挖掘的企业用电量分析与预测方法,其特征在于:在所述步骤S5中,采用试凑法确定隐含层神经元个数,搭建三层循环神经网络模型,将企业用电量与其相关性高的影响因素作为输入结点,输出企业用电量的预测值;利用反向传播算法对循环神经网络进行训练,用梯度下降法来修正权值,其学习速率为0.01。