1.一种基于扩散生成对抗网络和改进白鲸优化的入侵检测方法,其特征在于包括以下步骤:步骤S1、利用不平衡数据集训练扩散生成对抗网络,生成少数类别的样本;
步骤S2、生成样本与不平衡数据集结合,得到平衡数据集;
步骤S3、对平衡数据集利用改进白鲸优化算法进行特征选择、数据降维;
步骤S4、训练融合神经网络入侵检测模型Transformer—BiLSTM,检测网络攻击;
步骤S1中所述的扩散生成对抗网络包括基于扩散模型的数据加噪部分和基于生成对抗网络的数据生成部分,利用扩散生成对抗网络进行数据不平衡处理,通过将扩散模型与生成对抗网络相结合,利用扩散模型向生成的数据和真实数据添加噪音,利用生成对抗网络生成少数类别样本数据与原始数据集结合得到平衡数据集;
步骤S3中改进的白鲸优化算法采用二进制方式编码白鲸个体,每只白鲸由一个m维二进制向量,其中m为特征维数,若,则表示选择第j维特征,若,则表示不选择第j维特征,向量表示特征选择的一种可行解;
所述的改进白鲸优化算法,利用Tent混沌映射和精英反向学习进行种群初始化,之后种群个体在搜索空间进行全局搜索与局部搜索,通过非线性平衡因子调整种群搜索阶段,最后得到最优特征子集,对平衡数据集进行特征降维,利用改进BWO算法进行特征选择,改进BWO包括初始化、探索、开发和鲸鱼坠落的四个阶段,分别对应于初始化可行解、全局搜索、局部搜索和重新更新可行解;
步骤S4利用Transformer与BiLSTM融合的深度学习网络模型用于入侵检测检测,具体为:首先Transformer—BiLSTM模型的前半部分是由多个Transformer-Encoder组合而成,模型利用Transformer-Encoder部分学习数据的局部特征与全局特征,挖掘不同特征之间的联系,同时关注不同的贡献差别,其次模型的后半部分由BiLSTM组成,模型通过前面学习网络流量的局部特征信息和全局特征信息后,再通过BiLSTM对网络流量的时序特征进行学习。
2.根据权利要求1所述的一种基于扩散生成对抗网络和改进白鲸优化的入侵检测方法,其特征在于:所述的扩散模型数据加噪过程,通过利用扩散模型对原始数据和生成对抗网络生成的数据进行相同的前向扩散过程,从而获得具有不同程度噪声的真实样本和生成样本的噪声版本。
3.根据权利要求1所述的一种基于扩散生成对抗网络和改进白鲸优化的入侵检测方法,其特征在于:所述的生成对抗网络的数据生成过程,通过鉴别器区分真实样本和生成的噪声样本,学习原始数据的数据分布并利用学习到的数据分布生成少数类别的样本。
4.根据权利要求1所述的一种基于扩散生成对抗网络和改进白鲸优化的入侵检测方法,其特征在于:将扩散模型Diffusion与生成对抗网络CGAN结合得到Diffusion—CGAN模型进行数据不平衡处理,Diffusion—CGAN进行数据不平衡处理的过程如下:
1)划分训练集和测试集,分别将训练集、类别标签以及随机噪声输入到Diffusion—CGAN的生成器中;
2)生成器首次生成伪造样本,将伪造样本和真实样本进行相同的前向扩散过程,获得具有不同程度噪声的真实样本和生成样本的噪声样本;
3)将具有不同程度噪声的真实样本和生成样本输入判别器中,生成器与判别器相互对抗,最大最小化Diffusion—CGAN的目标函数,得到最优的生成器;
4)将训练集中的少数类别标签与随机噪声输入到训练后的最优生成器中;
5)生成器根据输入的类别标签,分别生成不同数量的少数类样本;
6)训练集中加入生成的少数类别样本,得到新训练集;
Diffusion—CGAN的目标函数如下述公式所示,
。
5.根据权利要求1所述的一种基于扩散生成对抗网络和改进白鲸优化的入侵检测方法,其特征在于:经过Tent映射得到初始化种群,其中,基于精英反向学习对初始种群进行优化,过程如下:首先计算初始种群每个个体的反向解,之后比较原始种群个体与其对应的反向解的适应度函数值,选择适应度值较优的个体作为初始种群个体,如公式(12)和公式(13)所示,利用精英反向学习优化初始种群,(12)
(13)
其中,表示初始种群个体,为可行解的最小值,为可行解的最大值,为(0,1)之间的随机数。
6.根据权利要求5所述的一种基于扩散生成对抗网络和改进白鲸优化的入侵检测方法,其特征在于:种群初始化之后进入探索阶段,每只白鲸不断探索改变位置,代表相应的特征选择可行解不断更新在探索阶段白鲸进行全局搜索,每两只白鲸组成一对在搜索空间镜像移动搜索最优可行解,白鲸的位置更新如公式(14):(14)
其中,T是当前迭代次数,是第i只白鲸在第j维上的新位置,(j=1,2,···,d)是从d维中选择的随机整数,是第i条白鲸在维度上的位置,和分别是第1条和第r条白鲸的当前位置,r是随机选择的白鲸,随机数和用于增强探索阶段的随机算子,和是(0,1)的随机数,和表示成对的两只白鲸在搜索空间中镜像地移动;
在开发阶段白鲸由全局搜索转为局部搜索,白鲸可以根据搜索空间中附近其他白鲸的位置来更新自己的位置,白鲸通过共享彼此的位置信息进行局部搜索,在开发阶段引入了莱维飞行策略,以增强收敛性,数学模型如公式(15)—(17)所示:(15)
(16)
(17)
其中,T是当前迭代次数,和分别是第i条白鲸和随机白鲸的当前位置,是第i条白鲸的新位置,是白鲸种群中的最优位置,和是(0,1)之间的随机数,是衡量莱维飞行强度的随机跳跃强度,u和v为正态分布随机数,β为默认常数,等于1.5;
种群在搜索最优解的过程中每只白鲸个体搜索移动时有一定概率坠落,为了确保种群中白鲸的数量恒定,坠落后的白鲸通过公式(18)来更新位置信息,更新位置后的白鲸表示新生的个体,新生白鲸继续在搜索空间寻找最优解,即在搜索空间中每个特征选择的可行解都有一定概率按公式被重新更新,数学模型公式(18)—(21)所示:(18)
(19)
= (20)
(21)
其中,、和是(0,1)之间的随机数,是白鲸坠落的步长,是与白鲸下降概率和种群规模相关的阶跃因子,为白鲸坠落概率,和分别是变量的上下限;
白鲸处于探索阶段时进行全局搜索,处在开发阶段时进行局部搜索,探索阶段到开发阶段的转换实际是全局搜索与局部搜索的转换,转换过程取决于平衡因子 ,如公式(22)所示:;
其中,T是当前迭代次,是最大迭代次数,Bo在每次迭代中在(0,1)之间随机变化,探索阶段发生在平衡因子 > 0.5时,而开发阶段发生在< 0.5,随着迭代次数T的增加,的波动范围从(0,1)非线性减小到(0,0.5)。