1.一种基于大数据的计算机网络安全分析系统,其特征在于,包括数据采集模块、数据预处理模块、特征提取模块、风险评估模块、安全预警模块、防护策略生成模块以及智能协同模块;
数据采集模块用于收集网络流量数据、系统日志数据以及用户行为数据,所述数据采集模块具备外部威胁情报数据采集功能,通过利用网络爬虫技术从公开的安全信息源中获取最新的威胁情报数据;
数据预处理模块采用数据清洗算法,去除常规的噪声数据和错误数据,根据数据的时间序列特征和网络业务逻辑关联性,对异常数据进行检测和修复,其数据清洗效果评估公式为其中C表示数据清洗效果评估值,Nclean表示清洗后正确数据的数量,Ntotal表示原始数据总量,α为调整系数,Tconsistency表示数据的时间一致性指标;
特征提取模块运用机器学习算法和深度学习模型,从预处理后的数据中提取关键特征信息,引入基于生成对抗网络GAN的特征增强技术,通过生成器和判别器的对抗训练,生成具有代表性和鲁棒性的特征表示;
风险评估模块依据提取的特征信息,结合创新的风险评估模型对网络安全风险进行量化评估,风险评估模型包括网络基础架构风险评估子模型、应用程序安全风险评估子模型以及用户行为风险评估子模型,其综合风险评估公式为其中R表示综合风险评估值,Rinfrastructure表示网络基础架构风险评估值,Rapplication表示应用程序安全风险评估值,Rbehavior表示用户行为风险评估值,β为威胁情报影响系数,Ithreat表示外部威胁情报风险指标值;
安全预警模块在风险评估结果超过预设阈值时,发出预警信息,包括声音警报或邮件通知或手机短信推送,预警模块根据风险的严重程度和紧急程度,自动调整预警的频率和方式,对于高风险紧急事件,采用连续高频的声音警报和即时短信推送,对于低风险事件,采用定期邮件通知;
防护策略生成模块根据风险评估结果和系统的安全需求,自动生成相应的防护策略,防护策略包括网络访问控制策略调整、系统漏洞修复建议、用户行为监控规则优化以及应急响应预案生成,防护策略生成的准确性和有效性评估公式为其中P表示防护策略的评估值,Neffective表示有效实施的防护策略数量,Ngenerated表示生成的防护策略总量,γ为响应时间调整系数,Tresponse表示防护策略的响应时间;
智能协同模块用于促进系统信息交流和协同工作,当数据采集模块发现异常数据时,通知特征提取模块进行重点特征提取,通知安全预警模块做好预警准备。
2.根据权利要求1所述的基于大数据的计算机网络安全分析系统,其特征在于,所述数据采集模块中的网络流量数据采集采用分布式数据采集架构,根据网络流量的动态变化自动调整采集频率,其采集频率调整公式为其中F表示采集频率,ω为基础采集频率值,为调整系数,Ttraffic表示网络流量变化指标值。
3.根据权利要求1所述的基于大数据的计算机网络安全分析系统,其特征在于,所述数据预处理模块中的数据格式标准化采用自适应数据格式转换算法,能够根据不同数据源的数据格式特点自动进行格式转换。
4.根据权利要求1所述的基于大数据的计算机网络安全分析系统,其特征在于,所述特征提取模块基于生成对抗网络的特征增强技术,其生成器和判别器的训练过程采用改进的对抗训练算法,训练损失函数为:其中L表示训练损失函数值,n表示训练样本数量,yi表示真实数据标签,xi表示真实数据样本,D表示判别器网络,G表示生成器网络,zi表示随机噪声向量,λ和μ为正则化系数,θG和θD分别表示生成器和判别器的网络参数。
5.根据权利要求1所述的基于大数据的计算机网络安全分析系统,其特征在于,所述风险评估模块中的网络基础架构风险评估子模型采用层次化风险评估方法,将网络基础架构划分为物理层、网络层和应用层,分别对每个层次进行风险评估,并根据层次之间的依赖关系进行综合评估,其综合评估公式为其中Rinfrastructure表示网络基础架构风险评估值,m表示层次数量,Wj表示第j个层次的权重系数,Rlayer,j表示第j个层次的风险评估值。
6.根据权利要求1所述的基于大数据的计算机网络安全分析系统,其特征在于,所述安全预警模块中的预警频率和方式调整采用智能预警策略算法,该算法根据风险评估结果和历史预警数据进行学习和优化,自动调整预警的频率和方式,其优化目标函数为其中O表示优化目标函数值,n表示预警事件数量,Ti表示第i个预警事件的响应时间,Fi表示第i个预警事件的频率调整系数,η为误报惩罚系数,Efalse表示误报次数,通过最小化响应时间和误报次数的加权和,实现最优的预警频率和方式调整。
7.一种应用权利要求1-6任意一项所述的基于大数据的计算机网络安全分析系统的方法,其特征在于,包括以下步骤:
S1、利用数据采集模块全面收集网络相关数据;
S2、通过数据预处理模块对采集到的数据进行处理,包括数据清洗、去噪和格式标准化;
S3、运用特征提取模块提取数据特征,采用机器学习算法和深度学习模型进行特征提取,并结合生成对抗网络技术进行特征增强;
S4、借助风险评估模块进行风险评估,采用多层次、多维度的风险评估模型结合外部威胁情报进行综合风险评估;
S5、根据风险评估结果进行相应的处理。
8.根据权利要求7所述的基于大数据的计算机网络安全分析方法,其特征在于,在风险评估步骤之后,根据评估结果判断是否触发安全预警模块进行预警,如果风险评估值超过预设的预警阈值,则启动安全预警模块,按照智能预警策略算法调整预警频率和方式,发出预警信息。
9.根据权利要求7所述的基于大数据的计算机网络安全分析方法,其特征在于,当风险评估完成后,若存在风险,利用防护策略生成模块自动生成相应的防护策略,防护策略的生成过程结合历史防护策略数据和当前风险评估结果进行优化,采用基于案例推理的防护策略生成算法,提高防护策略的准确性和有效性。
10.根据权利要求9所述的基于大数据的计算机网络安全分析方法,其特征在于,防护策略生成模块生成的防护策略包括网络访问控制策略调整、系统漏洞修复建议以及用户行为监控规则优化,在实施防护策略后,对防护效果进行实时监测和评估,根据评估结果对防护策略进行动态调整和优化,其优化公式为其中S表示防护效果评估值,Nsecure表示安全状态下的数据量或网络节点数量,Ntotal表示总数据量或网络节点总数,ξ为调整时间系数,Tadjust表示防护策略调整时间间隔。