1.一种电力系统暂态稳定结果的特征提取和聚类分析方法,其特征在于,包括以下步骤:步骤1对暂态稳定的特征数据进行归一化的预处理,以对数据进行聚类;
步骤2将预处理的数据利用改进的聚类算法进行特征提取和异常点判断;
步骤3对聚类效果进行有效性评价;
步骤4将从瞬态稳定中提取的数据特征结合地理位置信息进行分析,在步骤1中,归一化的特征数据预处理采用联合归一化方法,先后对列向量、行向量以最值法对其进行归一化处理;
在步骤2中,所述特征提取包括数据降维和高质量聚类两个步骤;
在步骤3中,通过轮廓系数对特征提取的聚类效果进行评价;
在步骤4中,在经典弹力模型图布局的基础上引入力导引模型,对图中节点地理位置进行调整;
在步骤2中,具体包括以下步骤:
步骤2‑1:对K‑means聚类算法运用统计学的线性回归和残差分析进行改进,根据标准化残差落点范围求取异常值从而得到聚类中心,且通过逆映射求得集群数目K,得到聚类数和聚类中心自确定的K均值算法即CANCS K‑means算法;
步骤2‑2:高质量聚类通过对由CANCS K‑means算法得到的新聚类再采用限定类之间直径来重新聚类;
在步骤2‑1中,在处理CANCS K‑means算法时步骤如下:(1)输入待聚类的数据集S={x1,x2,...,xN};
(2)将数据集S采用联合归一化方法进行标准化预处理,得到标准化的数据集(3)根据局部密度公式 及样本间欧式距离公式 求出中每一个数据对象的局部密度ρi和样本对象 到具有比它更高局部密度样本对象间的最近距离 k0_distancexi表示和样本对象xi最相邻的k0个对象的欧氏距离的和,其中ko=n×4%,当n小于100时,k0取3;
*
(4)令ρ=1/ρ,运用线性函数 去拟合ρi和δi的关系;a0为线性常数,a1为线性系数;
(5)计算每一个σi的残差 并将所有残差进行标准化处理,即将每一个残差除以它们的标准差;δi和 分别是xi对应的距离响应值和拟合值;
(6)在处理后的标准化残差中,筛选出残差绝对值大于3的数据,则这些点所对应的中的数据对象即为要寻找的聚类中心;
(7)以得到的数据对象为初始聚类中心ci,对 中的数据进行K‑means聚类操作;
*
(8)输出聚类结果 k为聚类数,ci为第i个聚类;
在步骤2‑1中的步骤(7)中,在对 中的数据再进行K‑means聚类操作时,采用以下步骤:
1)根据自动确定的聚类中心作为初始聚类中心;
2)利用公式 计算数据集中每个样本 到聚类中心ci的距离;
3)找到每个样本点到聚类中心ci的最小距离,并将样本点归类到对应的集群中;
4)再次计算同一类新的聚类中心 更新聚类中心;
5)重复以上步骤2)至步骤4),直到所有的聚类中心点不再发生变化或者达到最大运行次数。
2.根据权利要求1所述的一种电力系统暂态稳定结果的特征提取和聚类分析方法,其特征在于,在步骤2‑2中,高质量聚类算法步骤如下:*
(1)从K个集群的聚类中心列表中选择一个聚类中心ci;
(2)确定集群中每个节点与该聚类中心的欧式距离,如果距离小于预先指定的质量阈值距离,则将这两个节点聚集在一起;
(3)将依次选择该集群中的节点执行上步步骤(2),直到遍历该集群中的所有节点得到新的集群,重新计算集群数据平均值得到新的聚类中心c′i;
(4)选择第二个候选聚类集群,重复步骤上述步骤(2)、步骤(3),直到K个集群都重新归类计算得到新的聚类中心和集群,而集群个数不变。
3.根据权利要求1所述的一种电力系统暂态稳定结果的特征提取和聚类分析方法,其特征在于,在步骤3中,对于样本xi的轮廓系数Sil定义为:其中:ri表示每个聚类中样本个数,a(xi)表示样本xi到聚类中剩余样本的平均距离,b(xi)表示样本xi到其他聚类中样本的平均距离最小值,对于整个数据集,则可以通过平均轮廓指标来评价聚类结果有效性,表示如下:其中:N表示数据集样本大小,且 若 越接近1,聚类效果越好。
4.根据权利要求1所述的一种电力系统暂态稳定结果的特征提取和聚类分析方法,其特征在于,在步骤4中,对图中节点地理位置进行调整,步骤如下:(1)给所有的点一个初始的随机位置;
(2)首先计算节点之间相互排斥力,然后计算图中有边连接的节点相互吸引力,最后综合吸引力和排斥力,通过力的作用调整布局中节点的位置;
(3)重复上步步骤,直到网络区域平衡,或者迭代达到一定的次数。
5.根据权利要求4所述的一种电力系统暂态稳定结果的特征提取和聚类分析方法,其特征在于,在步骤4的步骤(2)中,采用FR算法调节节点位置,具体采用以下步骤:
1)计算网络平衡距离;
2)计算节点之间的几何距离;
3)获得相邻节点之间的吸引力函数;
4)获得相邻节点之间的排斥力函数。