知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

一种用户语音识别方法和装置

￥21500

专利号： 2019105787209

申请人：北京蓦然认知科技有限公司

专利类型：发明专利

专利状态：已下证

专利领域：乐器；声学

更新日期：2025-12-10

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种用户语音识别方法，其特征在于，所述方法包括：

步骤100，根据用户的声纹识别用户，得到用户ID；

步骤101，根据用户ID判断该用户是否为首次接入用户；

步骤102，如果该用户是首次接入用户，则根据该用户的声纹特征获得用户特征数据，根据用户特征数据加载对应的初始声学模型和初始语言模型；

步骤103，如果该用户不是首次接入用户，则根据该用户ID，分别加载与该用户对应的声学模型和语言模型。

2.根据权利要求1所述的方法，其特征在于，所述步骤102之后还包括步骤1021，对所述初始声学模型和初始语言模型进行训练，得到与该用户对应的声学模型和语言模型。

3.根据权利要求2所述的方法，其特征在于，所述步骤1021中，所述对初始声学模型和初始语言模型进行训练，得到与该用户对应的声学模型和语言模型具体为：根据该用户的语音识别记录该用户的高频词和/或不同场景常用的前缀词，积累用户数据，持续调整所述初始语言模型以得到与该用户对应的声学模型和语言模型。

4.根据权利要求3所述的方法，其特征在于，所述步骤1021中，还包括将所述用户的初始声学模型和/或初始语言模型分享到特定群体中进行训练。

5.根据权利要求4所述的方法，其特征在于，所述用户将初始声学模型和/或初始语言模型分享到特定群体中进行训练具体为：所述用户将所述初始声学模型分享到与该用户具有相同或相似发音习惯的群体中进行训练；和/或所述用户将所述初始语言模型分享到与该用户具有相同或相似的语言习惯的群体中进行训练。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述根据用户特征数据加载对应的初始声学模型和初始语言模型具体为通过声纹识别所述用户的地域和/或性别和/或年龄，对应的加载初始声学模型和初始语言模型。

7.根据权利要求1-6任一项所述的方法，其特征在于，所述用户向特定群体或其他用户分享与所述用户对应的语言模型或声学模型；

和/或，所述用户调用其他群体或其他用户的语言模型作为该用户的初始语言模型和/或所述用户调用其他群体或其他用户的声学模型作为该用户的初始声学模型。

8.一种用户语音识别装置，其特征在于，所述装置包括：

识别模块，根据用户的声纹识别用户，得到用户ID；

判断模块，根据用户ID判断该用户是否为首次接入用户；

模型加载模块，如果该用户是首次接入用户，则根据该用户的声纹特征获得用户特征数据，根据用户特征数据加载对应的初始声学模型和初始语言模型；如果该用户不是首次接入用户，则根据该用户ID，分别加载与该用户对应的声学模型和语言模型。

9.根据权利要求8所述的装置，其特征在于，还包括模型训练模块，用于对所述初始声学模型和初始语言模型进行训练，得到与该用户对应的声学模型和语言模型。

10.根据权利要求9所述的装置，其特征在于，所述模型训练模块，用于对所述初始声学模型和初始语言模型进行训练，得到与该用户对应的声学模型和语言模型具体为：根据该用户的语音识别记录该用户的高频词和/或不同场景常用的前缀词，积累用户数据，持续调整所述初始语言模型以得到与该用户对应的声学模型和语言模型。

11.根据权利要求10所述的装置，其特征在于，所述模型训练模块，还包括模型分享模块，用于将所述用户的初始声学模型和/或初始语言模型分享到特定群体中进行训练。

12.根据权利要求11所述的装置，其特征在于，所述模型分享模块，用于将所述用户的初始声学模型和/或初始语言模型分享到特定群体中进行训练具体为：所述用户将所述初始声学模型分享到与该用户具有相同或相似发音习惯的群体中进行训练；和/或所述用户将所述初始语言模型分享到与该用户具有相同或相似的语言习惯的群体中进行训练。

13.根据权利要求8-12任一项所述的装置，其特征在于，所述根据用户特征数据加载对应的初始声学模型和初始语言模型具体为通过声纹识别所述用户的地域和/或性别和/或年龄，对应的加载初始声学模型和初始语言模型。

14.根据权利要求8-13任一项所述的装置，其特征在于，所述模型分享模块还用于所述用户向特定群体或其他用户分享与所述用户对应的语言模型或声学模型；

15.一种用户语音识别装置，其特征在于，所述装置包括处理器和存储器，所述存储器中存储有可在处理器上运行的计算机程序，所述计算机程序在被所述处理器执行时实现如权利要求1-7任一项所述的方法。

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现如权利要求1-7任一项所述的方法。

17.一种车辆，其特征在于，所述车辆包括：如权利要求8-14任一项所述的装置。

18.一种终端，其特征在于，所述终端包括：如权利要求8-14任一项所述的装置。