1.网络流量数据采集系统,包括若干个代理服务器和总服务器,其特征在于:所述代理服务器用于对网络流量分区域进行采集、存储、分析后将分析数据和流量总数据的压缩打包文件发送至总服务器进行管理;
所述代理服务器包括数据采集模块、分区模块、存储模块和分析模块;所述数据采集模块用于实时采集每一个IP地址在软件、网页中的流量总数据以及当前总网速数据信息,并以文件的形式保存为流量文件;
所述分区模块用于将流量文件进行统计后按照流量种类、流量格式和时间间隔分布进行分区划分,采用F/J/G/S/T字母进行标识;
所述存储模块用于将分区模块统计划分后的流量数据进行存储、处理和过滤;
所述分析模块包括对比单元、分析单元和决策单元;
所述对比单元用于将存储模块中已经处理和过滤后的数据流量信息的活跃度和采集端口的活跃连接数阈值进行对比;
所述分析单元用于将存储模块中的数据进行分析并重排指令,通过读取解码的软件指令,判断该指令是否处理,并且将该存储模块中的数据优化执行指令,发送至决策单元;
所述决策单元用于将分析后重排指令进行决策,提供决策方案,并生成统计数据打包发送至总服务器,所述数据采集模块包括至少一个采集端口,所述采集端口用于采集网络流量的数据,所述数据采集模块包括判断模块和标识模块;
所述判断模块用于在采集的过程中对流量数据进行判断后得到标识,并将标识写入标识模块;
所述判断模块判断的基准包括流量单位字节发生的数据量和数据种类,将数据量打上流量单位标识,并将目前采集流量单位进行换算,将大于1G的数据标识为A类数据,小于1G且大于1MB的数据标识为B种数据,1MB以下的数据标识为K数据,所述分区模块用于对数据采集模块中的数据流量进行扫描,将位于指定目录及指定目录的文件,进行扫描,在扫描过程中,判断是否有匿名流量,若有匿名流量标识的数据信息,将匿名流量标识的数据信息归类为风险数据;
所述分区模块包括流量种类单元、流量格式单元和时间间隔分布类别单元;
所述流量种类单元包括泛流量、精准流量、公域流量、私域流量和推送流量;
所述泛流量包括微博、新闻频道浏览的信息产生的流量;
所述精准流量是用户通过索引或者关键字进行搜索而产生的具体流量;
所述公域流量是在浏览拼多多、京东平台产生的同有流量;
所述私域流量是用户软件自发性产生的流量,包括保存文件的流量;
所述推送流量是固定平台、网页、APP自动推送用户的数据信息进而产生推送流量。