1.一种采用联合特征与随机森林的伪装语音检测方法,其特征在于,包括以下步骤:S1、从训练语音库中随机选取真语音和伪语音,分别对随机选取的各语音进行LBP局部纹理特征和CQCC声学特征的提取,并将LBP局部纹理特征和CQCC声学特征联合组成联合特征向量,以得到训练数据集;
S2、利用训练数据集对随机森林进行训练,以生成随机森林分类器;
S3、将待测语音进行LBP局部纹理特征和CQCC声学特征的提取,并将LBP局部纹理特征和CQCC声学特征联合组成待测联合特征向量,将待测联合特征向量输入随机森林分类器以对待测语音进行真伪检测;
所述LBP局部纹理特征的提取,包括:
获取待提取语音的语谱图,利用LBP算法对待提取语音的语谱图进行分析,得到LBP局部纹理特征;
其中,待提取语音为随机选取的语音或待测语音;
利用LBP算法对待提取语音的语谱图进行分析之前,先对语谱图进行分块,然后对每块语谱图分别利用LBP算法对待提取语音的语谱图进行分析,得到各块语谱图的LBP局部纹理特征组成的LBP局部纹理特征向量。
2.根据权利要求1所述的一种采用联合特征与随机森林的伪装语音检测方法,其特征在于,所述CQCC声学特征的提取,包括:先对待提取语音进行常量Q变换得到频谱 ,然后得到对数功率谱,之后将对数功率谱重采样转换为 ,最后对重采样后
的对数能量谱作离散余弦变换,得到待提取语音的CQCC声学特征;
其中,k、l分别为重采样前、后的频带序号,待提取语音为随机选取的语音或待测语音。
3.根据权利要求2所述的一种采用联合特征与随机森林的伪装语音检测方法,其特征在于,所述将LBP局部纹理特征和CQCC声学特征联合组成联合特征向量,包括:采用主成分分析算法分别对LBP局部纹理特征和CQCC声学特征进行降维,然后将降维后的特征进行拼接,从而生成联合特征向量。
4.根据权利要求3所述的一种采用联合特征与随机森林的伪装语音检测方法,其特征在于,所述步骤S2,包括以下步骤:S21、假设训练数据集中共有N个矢量样本,从训练数据集中有放回地随机抽取 个矢量样本作为训练集样本来训练决策树,其中, ;
S22、每个矢量样本包含M个属性,M为联合特征向量的维数;决策树分裂时,随机选择个属性,根据基尼指数完成决策树分裂,判断是否无法继续分裂;若是,则转至步骤S23;若否,则继续根据基尼指数完成决策树分裂;
S23、生成决策树,并判断决策树数量是否小于目标数量;若是,则返回至步骤S21;若否,则生成随机森林分类器。