1.一种面向智能家居场景的语音识别控制方法,其特征在于,该方法包括以下步骤:S1、语音采集模块采集用户输入的语音指令;转至步骤S2;
S2、语音处理模块对语音采集模块采集的语音信号进行去噪处理,并发送到具有语音识别库的服务器中;语音处理模块基于先验信噪比的变形谱减法对语音信号进行去噪处理,具体方法如下:S201、输入麦克风拾取的声音信号;转至步骤S202;
S202、选择切比雪夫带通滤波留下[300,3400]频段的信号;转至步骤S203;
S203、对留取的频段信号进行分帧,帧长320,帧移160,即每帧20ms;转至步骤S204;
S204、对每帧信号进行加窗处理,采用矩形窗或汉明窗;加窗处理后对每一帧加过窗函数的信号进行有声/无声判决,具体方法如下:判断每帧信号是否为有声信号,若是有声信号,则将该帧信号转至步骤S205进行处理,若是无声信号,则更新噪声谱,然后将该帧信号转至步骤S208进行处理;
S205、求出带噪语音的短时能量和短时平均过零率,并求出门限初值;根据下式计算带噪语音的短时能量Qn,其中,x(m)为带噪语音信号序列,并且当T[x(m)]=x2(m)时,通过上式计算带噪语音的短时能量,当T[x(m)]=|sgn[x(m)]-sgn[x(m-1)]|,且 时,通过上式计算带噪语音的短时平均过零率,ω(n-m)为有限长度的窗序列,用来截取语音信号;
设s(i)为带噪语音的某一帧信号,则其短时能量为 则其短时过零率为 ZRC表示一帧信号样本改变符号次数即过零率,其中,
根据下式计算门限初值h1,
h1=a1×max(FF)+a2×min(FF)FF=ln(amp/ZCR)
其中,a1+a2=1,且a1>0,a2>0;
转至步骤S206;
S206、对每帧信号的语音和噪声做出首次判断,然后将连续6帧低于门限初值的帧判为噪声帧,并赋0,其余判为语音帧Voice_frame;对语音和噪声做出首次判断的方法如下:根据设定的门限值,对语音和噪声进行比较,然后对连续6帧低于门限的帧判为噪声帧,并赋0;
转至步骤S207;
S207、对语音帧Voice_frame做FFT变换;转至步骤S208;
S208、求出先验信噪比SNRprio;根据下式求出先验信噪比SNRprio,其中,S(ω)表示语音信号的短时谱, 表示噪声的短时谱;
转至步骤S209;
S209、计算出增益G(w),然后乘上判为语音帧的带噪语音信号,得出语音估计;根据下式计算增益G(w,i),其中,SNRprio(w,i)为先验信噪比,i为帧数;
根据下式计算语音估计值
其中,G(ω)为增益,|Y(ω)|为语音帧的带噪语音信号;
转至步骤S210;
S210、对FFT变换的语音帧Voice_frame恢复相位,并做IFFT变换;转至步骤S211;
S211、对IFFT变换的语音帧进行去重叠处理,然后从增强后的重叠信号中抽取出最终的纯净语音信号估计,输出纯净语音;
转至步骤S3;
S3、服务器根据语音识别库对语音处理模块处理后的信号进行匹配得到相应的反馈信号;转至步骤S4;
S4、命令生成模块对服务器输出的反馈信号进行处理生成命令字符;转至步骤S5;
S5、控制模块根据命令生成模块输出的命令字符对智能设备进行控制;转至步骤S6;
S6、智能家居设备响应控制模块输出的执行命令并反馈其响应情况。