1.一种基于密度峰值多属性聚类的网络日志分析方法,其特征在于:包括如下步骤:步骤一,将网络日志数据输入到分布模型内,通过分布模型输出网络日志数据分布图;
步骤二,针对离散点状分布的网络日志数据采用密度峰值聚类算法进行聚类,得到聚类结果;
步骤三,对步骤二中获得的聚类结果进行分析,输出分析结果;
其中,步骤一中的分布模型内具有若干个选择权项,通过选择不同的选择权项,使得网络日志数据在分布模型输出不同样式的网络日志数据分布图;所述步骤一中分布模型的选择权项包括用户内容权项、用户点击权项和用户访问时间权项,所述步骤一的分布模型进行如下步骤:步骤一一,输入网络日志数据前,先让工作人员选择选择权项,在选择完成以后进行后续步骤;
步骤一二,当工作人员选择用户内容权项时,以服务器所能够提供的站点内容作为竖轴,以用户查看站点内容的时间作为横轴,将网络日志数据输入到该坐标轴内,使得网络日志数据在坐标轴上形成离散的多个数据点;
步骤一三,当工作人员选择用户点击权项时,以用户访问服务器总体时间作为竖轴,以用户点击次数作为横轴,将网络日志数据输入到该坐标轴内,使得网络日志数据在坐标轴上形成离散的多个数据点;
步骤一四,当工作人员选择用户访问时间权项时,以用户访问服务器的单次时间为竖轴,以用户点击次数作为横轴,将网络日志数据输入到该坐标轴内,使得网络日志数据在坐标轴上形成离散的多个数据点;所述步骤三中对步骤二中获得聚类结果进行分析的步骤如下:步骤三一,对聚类结果中的各个簇进行标记,同时计算各个簇内的数据点的数量;
步骤三二,提取出步骤三一中数据点数量最多的簇,提取出该簇内数据点的站点内容和用户访问时间,以作为分析结果输出。
2.根据权利要求1所述的基于密度峰值多属性聚类的网络日志分析方法,其特征在于:所述步骤三中输出分析结果后还具有执行步骤:
步骤四,接收到分析结果后,将工作人员选择用户内容权项的分析结果、选择用户点击权项以及选择用户访问时间权项相互整合成用户喜好结果;
步骤五,将用户喜好结果融合到现有的网络提供内容数据内,同时计算各个数据点的局部密度;
步骤六,将用户喜好结果对应的数据点作为聚类中心,采用密度峰值聚类算法对网络提供内容数据点进行聚类;
步骤七,将步骤六中的聚类结果进行分类,划分为用户喜欢簇和用户不喜欢簇。
3.根据权利要求2所述的基于密度峰值多属性聚类的网络日志分析方法,其特征在于:所述步骤四中的整合步骤具体包括如下:
步骤四一,分别提取用户内容权项时聚类结果中数量最大的簇、用户点击权项时聚类结果中数量最大的簇和用户访问时间权项时数量最大的簇;
步骤四二,计算用户内容权项的簇中用户内容的中位数作为用户喜好内容,计算用户点击权项的簇中用户点击的中位数作为用户喜好中的用户点击习惯,计算用户访问时间的簇中用户访问时间的中位数作为用户喜好中的用户访问时限;
步骤四三,将步骤四二中获得的用户喜好内容、用户点击习惯和用户访问时限构成一个三维数据点代表用户喜好结果;
步骤四四,根据步骤四三获得的三维数据点搭建三维坐标轴,将网络提供内容数据输入该三维坐标轴内,作为聚类数据集。