1.基于时间序列聚类的云服务器异常检测方法,其特征在于,提取云服务器上性能资源时间序列数据,用小波包分解的方式预处理时间序列数据,然后利用K‑means聚类算法进行聚类,再用邓恩指数DVI对聚类结果进行评价,根据评价结果筛选出异常的时间序列。
2.根据权利要求1所述的基于时间序列聚类的云服务器异常检测方法,其特征在于,具体包括以下步骤:
步骤1,提取云服务器上性能资源时间序列数据;
步骤2,对提取的时间序列数据进行三层小波包分解预处理;
步骤3,对步骤2中预处理后的数据按时间段进行分组,一组即为一个对象,对删除每一个对象后的数据进行n次K‑means聚类,采用邓恩指数DVI对聚类结果进行聚类质量评价,得到DVI数组{DVI1,DVI2,DVI3,…,DVIn};
步骤4,采用极大似然估计方法,设置阈值,根据阈值对数组DVI中离群点进行筛选和识别,离群点即云服务器异常时间序列数据。
3.根据权利要求2所述的基于时间序列聚类的云服务器异常检测方法,其特征在于,所述步骤1中云服务器上性能资源时间序列数据包括CPU空闲率数据、系统可用内存数据和网络上传下载速率。
4.根据权利要求2所述的基于时间序列聚类的云服务器异常检测方法,其特征在于,所述步骤2中,对提取的时间序列数据进行三层小波包分解预处理,包括将时间序列数据进行多层次划分,对每个分解后的频带均进行再次的降半划分,通过低通滤波器h和高通滤波器g,利用小波包分解公式对提取的时间序列数据进行分解,具体如下:
2p
其中, 表示原始信号通过第一层小波变换得到的信号,ψ (t)表示原始信号通过
2p+1
第二层小波变换得到的信号,ψ (t)表示原始信号通过第三层小波变换得到的信号,p表示频率参数,q表示尺度参数,r表示平移参数,h(r)和g(r)是一组共轭镜像滤波器函数,小波包分解过程是将离散信号通过一个低通滤波器h和一个高通滤波器g进行滤波的过程。
5.根据权利要求2所述的基于时间序列聚类的云服务器异常检测方法,其特征在于,所述步骤3包括把步骤2中预处理后的数据按时间段分为n组,构成样本空间D={S1,S2,S3,…,Sn},一组即为一个对象,得到的样本空间中n个对象,每次删除样本空间中一个对象Si共进行n次K‑means聚类,其中K‑means算法用欧式距离表示数据之间的差异,通过直接求均值来计算聚类的中心点,具体步骤如下:
步骤3.1,确定初始聚类中心点m1,m2,…,mn,…,mK;
步骤3.2,将初始聚类中心点之外的其他对象分配到与其距离最小的初始聚类中心点所在的类;
步骤3.3,按照欧式距离平均值最小原则更新每个聚类的中心点;
步骤3.4,判断K‑means算法是否收敛,若收敛,返回聚类结果,若没有收敛,重复步骤
3.2和步骤3.3,直至K‑means算法收敛再返回聚类结果。
6.根据权利要求5所述的基于时间序列聚类的云服务器异常检测方法,其特征在于,所述步骤3.1中,使用K‑means++方法确定初始聚类中心点,随机选取第一个初始聚类中心点(n=1),则在选取第n+1个初始聚类中心点时,距离当前n个初始聚类中心点越远的点会有更高的概率被选为第n+1个初始聚类中心点。
7.根据权利要求6所述的基于时间序列聚类的云服务器异常检测方法,其特征在于,所述步骤4中,采用极大似然估计方法,计算DVI数组的均值μ和标准差σ,在正态分布假定下,设置阈值为3,当目标函数E=|DVIi‑μ|/σ大于3时,被识别为离群点,离群点即为云服务器资源异常时间序列数据。