1.一种基于数据分析的工业控制网络安全风险评估方法,其特征在于:包括以下步骤:步骤一:通过网络中的各类传感器、日志系统和安全设备,采集历史安全数据和实时数据,包括设备通讯错误率Perr、流量波动性系数Ffluc、网络延迟峰值Ndelay和设备故障触发频率Efail,组成数据集W;
步骤二:对采集的数据集W进行预处理,包括去除异常值、数据降噪、缺失数据填补和标准化处理,获取标准数据集WB;
步骤三:通过使用特征提取算法从标准数据集WB中提取出风险指标,包括历史安全事件的发生频率Fev、事件影响程度Iev和时间间隔,获取风险特征值;从标准数据集WB中提取与安全事件相关的时间戳,统计在一定时间窗口发生的安全事件次数,获取安全事件的发生频率Fev;
所述安全事件的发生频率Fev通过以下公式获取:
,式中表示在时间窗口内发生的安全事件总数;表示时间窗口的长度;
计算连续安全事件之间的时间间隔,所述时间间隔通过以下公式获取;
;
式中,表示第i个事件与第i+1个事件之间的时间间隔,表示第i个事件的时间戳,表示第i+1个事件的时间戳;
基于每个事件的影响范围,包括受影响的设备数量、数据丢失量和停机时间,综合评估事件影响程度Iev;所述事件影响程度Iev通过以下公式获取:;
式中,表示受影响的设备数量,表示数据丢失量,表示因事件引起的停机时间,、和,分别表示受影响的设备数量、数据丢失量和停机时间的预设权重值;
通过分析历史安全事件的发生频率Fev和时间间隔,识别出高频和密集型事件,在基于事件影响的多维因素,根据事件影响程度Iev,提供高风险事件的优先处理依据,获取风险特征值;所述风险特征值通过以下公式获取:;
式中,Fev表示安全事件的发生频率,表示时间间隔,Iev表示事件影响程度,、和分别表示安全事件的发生频率Fev,时间间隔;和事件影响程度Iev的权重系数;
步骤四:通过使用大数据分析方法,对提取出的风险特征值进行趋势分析,识别出安全事件的风险趋势,通过使用多元回归分析,计算风险趋势系数;使用多个影响因素作为自变量对险特征值Fak进行多元回归分析,计算出每个自变量对险特征值的影响,其中影响因素包括设备通讯错误率Perr、流量波动性系数Ffluc、网络延迟峰值Ndelay和设备故障触发频率Efail;
多元回归公式为:
;
式中,表示时间t时的风险特征值,表示回归方程中的常数项,G表示误差项,、、和分别表示设备通讯错误率Perr、流量波动性系数Ffluc、网络延迟峰值Ndelay和设备故障触发频率Efail的回归系数;基于时间t时的风险特征值,提取影响因素对应的回归系数,获取风险趋势系数Rte;通过风险趋势系数Rte来预测未来一段时间内风险的变化趋势;所述风险趋势系数Rte通过以下公式获取:;
式中,表示风险特征值对时间的导数,表示在时间窗口内发生的安全事件总数,表示时间窗口的长度,表示第i类事件的频率,λ表示时间衰减因子,表示指示函数;
步骤五:通过动态阈值Td与获取的风险趋势系数Rte进行动态风险评估,当风险趋势系数Rte超过动态阈值Td时,系统生成警报;通过动态阈值Td与获取的风险趋势系数Rte进行动态风险评估,获取风险特征分析结果,风险趋势系数Rte超过动态阈值Td时,系统生成警报,进行适应风险环境的变化;所述动态阈值Td通过以下公式获取:;
其中,表示风险趋势系数Rte的历史均值,表示风险趋势系数Rte的历史标准差,L表示可调节的安全系数;
步骤六:当系统生成警报时,系统会生成安全警报并自动生成报告,报告包括风险趋势的变化情况、风险特征分析结果以及建议的防护措施;
识别并连接网络中的各类传感器、日志系统和安全设备,通过SNMP网络协议从设备中获取数据包括设备通讯错误率Perr、流量波动性系数Ffluc、网络延迟峰值Ndelay和设备故障触发频率Efail;其中各类传感器包括通讯错误传感器、网络流量传感器、网络延迟传感器和设备故障传感器,通讯错误传感器对设备通讯错误率Perr进行采集,网络流量传感器对流量波动性系数Ffluc进行采集,网络延迟传感器对网络延迟峰值Ndelay进行采集,设备故障传感器对设备故障触发频率Efail进行采集;将从各设备获取的实时和历史数据传输至中央处理系统,将不同源头的数据转换为统一格式,组成数据集W;
通过使用机器学习算法检测和删除异常值,通过使用滤波和平滑算法来减少噪声干扰和去除噪声;通过使用均值插值法填补缺失数据,均值插值法公式如下:;
式中,Wi表示缺失的数据点,Wj表示非缺失数据点,n表示非缺失数据的数量;
通过使用Z-score标准化方法对数据集w进行标准化处理,将不同特征的取值范围统一,获取标准数据集WB;
将获取的风险特征值按照一个月为时间单位进行时间序列分割,形成不同时间窗口的数据子集Xsub;所述数据子集Xsub 通过以下公式获取:;
式中,表示在时间段,,…,内的子集,包含每个时间段内的风险特征值;表示在第i个时间段内的风险特征值。
2.根据权利要求1所述的一种基于数据分析的工业控制网络安全风险评估方法,其特征在于:将获取的风险趋势系数Rte与动态阈值Td进行对比:获取风险特征分析结果;
当风险趋势系数Rte>动态阈值Td时,获取风险特征分析结果为异常;
当风险趋势系数Rte=动态阈值Td时,获取风险特征分析结果为不合格;
当风险趋势系数Rte<动态阈值Td时,获取风险特征分析结果为合格。
3.根据权利要求2所述的一种基于数据分析的工业控制网络安全风险评估方法,其特征在于:当风险特征分析结果为异常和不合格时,自动生成安全警报,记录当前状态及报警信息BJ;所述报警信息BJ通过以下公式获取:;
式中,时间表示为警报生成的具体时间,状态信息包括流量波动性系数Ffuc和网络延迟峰值Ndelay,表示风险特征值。
4.根据权利要求3所述的一种基于数据分析的工业控制网络安全风险评估方法,其特征在于:根据警报信息BJ,整合风险趋势变化、风险特征分析结果和建议的防护措施,生成报告,其中风险趋势变化包括描述风险趋势系数Rte相对于历史数据的变化情况,风险特征分析包括展示风险趋势系数Rte与动态阈值Td进行对比情况,防护措施包括基于当前风险状态提出的具体防护措施。