欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2017104142077
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于人工智能的语音识别方法,其特征在于,包括:获取待识别的语音数据;

利用训练后的子带能量归一化声学模型,对所述待识别的语音数据进行处理,确定所述待识别的语音数据中各时频单元对应的归一化能量特征;

根据所述各时频单元对应的归一化能量特征,确定所述待识别的语音数据对应的文本数据。

2.如权利要求1所述的方法,其特征在于,所述利用预设的子带能量归一化声学模型,对所述待识别的语音数据进行处理之前,还包括:获取训练语音数据;

利用所述训练语音数据,对初始子带能量归一化声学模型进行训练,确定训练后的子带能量归一化模型及各子带分别对应的平滑参数。

3.如权利要求2所述的方法,其特征在于,所述利用所述训练语音数据,对初始子带能量归一化声学模型进行训练之前,还包括:根据预设的规则,确定各子带分别对应的初始平滑参数。

4.如权利要求1-3任一所述的方法,其特征在于,所述利用训练后的子带能量归一化声学模型,对所述待识别的语音数据进行处理之前,还包括:对所述待识别的语音数据进行预处理,确定所述待识别的语音数据中各时频单元对应的滤波器组能量值;

所述利用训练后的子带能量归一化声学模型,对所述待识别的语音数据进行处理,包括:所述利用训练后的子带能量归一化声学模型,对所述待识别的语音数据中各时频单元对应的滤波器组能量值进行处理。

5.如权利要求4所述的方法,其特征在于,所述确定所述待识别的语音数据中各时频单元对应的归一化能量特征,包括:确定第i帧语音数据中第j个时频单元对应的滤波器组能量值E(i,j)及各子带分别对应的平滑参数sj;

获取第i-1帧语音数据中第j个时频单元对应的平滑后的滤波器组能量值M(i-1,j);

根据所述E(i,j)、sj及M(i-1,j),确定所述第i帧语音数据中第j个时频单元对应的平滑后的滤波器组能量值M(i,j)。

6.一种基于人工智能的语音识别装置,其特征在于,包括:第一获取模块,用于获取待识别的语音数据;

第一确定模块,用于利用训练后的子带能量归一化声学模型,对所述待识别的语音数据进行处理,确定所述待识别的语音数据中各时频单元对应的归一化能量特征;

第二确定模块,用于根据所述各时频单元对应的归一化能量特征,确定所述待识别的语音数据对应的文本数据。

7.如权利要求6所述的装置,其特征在于,还包括:第二获取模块,用于获取训练语音数据;

第三确定模块,用于利用所述训练语音数据,对初始子带能量归一化声学模型进行训练,确定训练后的子带能量归一化模型及各子带分别对应的平滑参数。

8.如权利要求7所述的装置,其特征在于,还包括:第四确定模块,用于根据预设的规则,确定各子带分别对应的初始平滑参数。

9.如权利要求6-8任一所述的装置,其特征在于,还包括:第五确定模块,用于对所述待识别的语音数据进行预处理,确定所述待识别的语音数据中各时频单元对应的滤波器组能量值;

所述第一确定模块,具体用于:

所述利用训练后的子带能量归一化声学模型,对所述待识别的语音数据中各时频单元对应的滤波器组能量值进行处理。

10.如权利要求9所述的装置,其特征在于,所述第一确定模块,还用于:确定第i帧语音数据中第j个时频单元对应的滤波器组能量值E(i,j)及各子带分别对应的平滑参数sj;

获取第i-1帧语音数据中第j个时频单元对应的平滑后的滤波器组能量值M(i-1,j);

根据所述E(i,j)、sj及M(i-1,j),确定所述第i帧语音数据中第j个时频单元对应的平滑后的滤波器组能量值M(i,j)。

11.一种终端,包括:

存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一所述的基于人工智能的语音识别方法。

12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的基于人工智能的语音识别方法。