1.一种基于图论相关理论进行异常检测的方法,其特征在于:该方法具体包括以下步骤:第一步,将原始数据集进行聚类操作,将数据集分割成不同的簇;
第二步,计算出原始数据集的均值密度及每个簇的相应密度,将原数据集均值密度作为阈值与簇密度比较对数据集进行精简;
第三步,对数据集进行特征提取和空间距离计算并对结果进行数据化操作,具体步骤为:S1:在原始数据集中选取相应的一至两个特征进行提取,所述特征包括图像的纹理,强度;
S2:计算非聚类中心数据点与聚类中心点的空间距离;
S3:对相应的数据矩阵采用稀疏矩阵解法再次精简数据;
S4:将最后结果前20%的数据所对应的数值化为权重值,利用负相关理论调节相应数据值;
第四步,将有效检测的数据簇的所有数据点按计算出来的权重值分配构建无向连通图;
第五步,采用弗洛伊德算法查找相应簇的最短路径;
所述第一步将原始数据集进行聚类操作,具体步骤包括:步骤一:给定原始数据集 ;
步骤二:“K均值”算法针对聚类所得簇划分 ;
步骤三:最小化误差 ,其中 是 的均值向量;
所述第二步的计算出原始数据集的均值密度及每个簇的相应密度,将原数据集均值密度作为阈值与簇密度比较对数据集进行精简的具体步骤包括;
步骤(1):将这k个簇按照 分别计算其簇密度,其中密度计算函数为 , 为自定义的距离称为截断距离;再计算出原始数据集 的均值密度 ;将计算出来的簇密度与原始数据集均值密度结果进行比较;
步骤(2):当 ,则设置对应的簇 的标签为1,反之亦反;
步骤(3):将标记为0的簇剔除,减少执行异常检测的数据量;
所述第三步对原始数据集进行相应特征的提取并数据化,计算聚类中心点与其他点的空间位置距离的具体步骤包括;
A:对原始数据集进行相应特征的提取;
B:将提取的特征信息数据化,并利用稀疏矩阵再次精简数据集,;
C:计算聚类中心点与其他数据点的空间位置距离,;
D:将计算出来的距离呈现为二维坐标化数据点,将远离坐标原点的点给出一个为所有权重分数的20%的权重分数;
所述第四步将有效检测的数据簇的所有数据点按计算出来的权重值分配构建无向连通图,具体步骤包括;
(1)将各个簇的聚类中心点作为起始点以空间距离值为依据构成相应数据点距离信息矩阵;
(2)以距离信息矩阵为基础构建无向连通图;
(3)将第三步所得权重分数分配到相应路径作为构成无向连通图的权重信息。
2.根据权利要求1所述的一种基于图论相关理论进行异常检测的方法,其特征在于,所述第五步采用弗洛伊德算法查找相应簇的最短路径,具体步骤包括:(1)用D[v][w]记录每一对顶点的最短距离;
(2)依次扫描每一个点,并以其为基点再遍历所有每一对顶点D[v][w]的值,看是否可用该基点让这对顶点间的距离更小。