1.一种针对语音识别系统的黑盒对抗样本攻击方法,其特征在于:包括,S1,种群初始化;
S2,计算种群中个体的适应度值;
s3,判断个体的适应度值是否满足设定条件,若是,则获得对抗样本,若否,则执行S4;
S4,对种群中的个体进行选择操作获取精英个体;
S5,对种群中获取精英个体后的剩余个体进行交叉操作;
S6,对剩余个体执行变异操作;
S7,将执行变异操作后的剩余个体与精英个体构成下一代并返回执行S1。
2.根据权利要求1所述的黑盒对抗样本攻击方法,其特征在于:所述s1中的种群的个体由如下公式获得:
pi=x+ri×wi,i=1,2,…,N,其中x为待修改的音频样本,N表示种群规模,pi表示种群中第i个个体的初始化,ri为向第i个个体中添加的随机扰动,wi为根据待修改的音频样本x计算的扰动权重向量ri,j由如下公式获得:ri,j=R(-b,b),j=1,2,…M,其中M表示单个个体的基因数,ri,j个个体中的第j个基因,b表示扰动的取值范围b=
256;R()是随机函数,该函数从[-b,b]范围内随机选择一个整数;
wi,j由如下公式获得:
其中wi,j表示第i个个体的第j个基因的权重,qmin,q,qmax分别表示权重的取值范围,其中qmin,=0.6,q=1,qmax=2;R′()是随机函数,该函数在区间[qmin,q](或[q,qmax])内生成一个随机数作为当前基因的权重;|·|表示绝对值函数;函数Sort()表示对变量进行从大到小的排序。
3.根据权利要求2所述的黑盒对抗样本攻击方法,其特征在于:所述S2中适应度值采用如下公式进行计算:s=f(p),
其中f()是目标语音识别网络的函数,该函数接收个体p作为输入,输出相应的翻译结果s;Levenshtein(s,t)是指将个体的文本识别结果s通过插入、删除或替换转换成目标文本t所需要的最小单字符编辑次数;H是指目标文本t的字符个数。
4.根据权利要求3所述的黑盒对抗样本攻击方法,其特征在于:所述S3中的设定条件为,WER值为0。
5.根据权利要求3所述的黑盒对抗样本攻击方法,其特征在于:所述S4中选择操作包括,对个体的适应度值进行降序排序,得到排完序的种群p′=(p1′,p2′,...,pN′),取前topk个个体作为精英个体P′topk。
6.根据权利要求5所述的黑盒对抗样本攻击方法,其特征在于:所述S5中的剩余个体为N-topk个,所述S5中交叉操作包括,首先,随机从N-topk个剩余个体p′N-topk中取两个个体作为父代1和父代2;然后,生成个体基因长度的随机数向量λ,其中随机数的范围为[0,1],最后子代的取值基于随机数向量λ,规则如下公式所示:上式中子代offspring的第i个基因的值根据随机向量中λ第i个值决定;若λi小于0.5,子代第i个值取自父代1中第i个基因parent1i的值;否则,子代第i个值取自父代2中第i个基因parent2i的值,最终生成N-topk个子代。
7.根据权利要求6所述的黑盒对抗样本攻击方法,其特征在于:所述S6中变异操作采用如下公式进行,
new_pi=offspringi+ri×wi,i=1,2,…,N-topk。