欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2022114870692
申请人: 深圳市人马互动科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 乐器;声学
更新日期:2025-04-29
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语音识别方法,其特征在于,应用于语音识别系统中的服务器,所述语音识别系统包括所述服务器和用户进行语音互动的终端设备,所述服务器包括支持人机语音交互的人机互动引擎,所述方法包括:调用所述人机互动引擎通过所述终端设备与所述用户进行互动,获取所述互动过程中所述用户输入的目标语音信息;以及,对所述目标语音信息进行文字识别,得到第一文本;

对所述第一文本进行场景识别,确定所述第一文本对应的目标服务场景,所述目标服务场景用于表征所述第一文本所表达的需要提供的服务类型;

对所述第一文本进行场景关联词提取,得到所述第一文本对应的目标场景关联词,所述目标场景关联词用于表征所述第一文本所表达的需要提供的所述服务类型的服务内容;

根据所述目标服务场景进行场景热词集合查询,得到与所述目标服务场景对应的目标场景热词集合;

将所述目标场景关联词与所述目标场景热词集合中的场景热词进行拼音对比,得到所述目标场景关联词与所述目标场景热词集合中的场景热词的差异值得分,所述场景热词为热度大于热度阈值的词汇,所述热度是指词汇在全部用户中的查询热度;

确定所述目标场景热词集合中差异值得分最高的目标场景热词;

用所述目标场景热词替换所述第一文本中的目标场景关联词,得到第二文本;

根据所述第二文本确定所述目标语音信息所表达的用户意图;以及,根据确定出的用户意图执行对应的服务操作;

所述将所述目标场景关联词与所述目标场景热词集合中的场景热词进行拼音对比,得到所述目标场景关联词与所述目标场景热词集合中的场景热词的差异值得分,包括:确定所述目标场景热词集合中是否存在与所述目标场景关联词的拼音完全相同的第一词汇;

若存在,则确定所述第一词汇的数量是否大于1;

若是,则确定所述用户是否曾经针对所述第一词汇进行过查询;

若是,则确定所述第一词汇中被查询过的第二词汇的数量是否大于1;

若是,则确定所述用户针对每个所述第二词汇的查询时间与当前时间的时间间隔是否大于预设间隔;

若是,则确定所述第二词汇中查询次数最多的场景热词的差异值得分最高;

若否,则确定所述第二词汇中查询时间与当前时间的时间间隔最短的场景热词的差异值得分最高。

2.根据权利要求1所述的方法,其特征在于,所述确定所述目标场景热词集合中是否存在与所述目标场景关联词的拼音完全相同的第一词汇之后,若不存在所述第一词汇,则对所述目标场景关联词的拼音进行拼音替换,得到替换后的拼音;以及,将所述替换后的拼音与所述目标场景热词集合中的场景热词进行比对,得到所述目标场景关联词与所述目标场景热词集合中的场景热词的差异值得分;以及,所述确定所述第一词汇的数量是否大于1之后,若所述第一词汇的数量等于1,则确定所述第一词汇的差异值得分最高;以及,所述确定所述用户是否曾经针对所述第一词汇进行过查询之后,若所述用户曾经针对所述第一词汇未进行过查询,则确定所述第一词汇中热度最大的场景热词的差异值得分最高;以及,所述确定所述第一词汇中被查询过的第二词汇的数量是否大于1之后,若所述第二词汇的数量等于1,则确定所述第二词汇的差异值得分最高。

3.根据权利要求2所述的方法,其特征在于,所述对所述目标场景关联词的拼音进行拼音替换,得到替换后的拼音,包括:确定所述用户的籍贯和/或生活地址;

确定所述籍贯和/或所述生活地址对应的发音特色;

根据所述发音特色确定所述目标场景关联词对应的每个拼音中可进行拼音替换的拼音数量;

若所述拼音数量大于1,则根据所述目标场景关联词中需要进行拼音替换的每个字的出现顺序,依次进行拼音替换,得到多个替换拼音。

4.根据权利要求3所述的方法,其特征在于,所述将所述替换后的拼音与所述目标场景热词集合中的场景热词进行比对,得到所述目标场景关联词与所述目标场景热词集合中的场景热词的差异值得分,包括:确定所述多个替换拼音中是否存在与所述目标场景热词集合中的场景热词的拼音完全相同的目标替换拼音;

若存在,则确定所述目标替换拼音的数量;

若所述目标替换拼音的数量为1个,则确定所述目标替换拼音对应的场景热词的差异值得分最高;

若所述目标替换拼音的数量为至少两个,则根据所述目标替换拼音中被替换的拼音的数量,和所述用户针对所述目标替换拼音对应的场景热词的使用次数或者热度计算每个所述目标替换拼音对应的场景热词的差异值得分。

5.根据权利要求4所述的方法,其特征在于,所述根据所述目标替换拼音中被替换的拼音的数量,和所述用户针对所述目标替换拼音对应的场景热词的使用次数或者热度计算每个所述目标替换拼音对应的场景热词的差异值得分,包括:确定所述目标替换拼音中被替换的拼音最少的第一拼音,并确定所述第一拼音的数量是否大于1;

若所述第一拼音的数量大于1,则确定所述用户是否使用过所述第一拼音对应的场景热词;

若所述用户使用过所述第一拼音对应的场景热词,则确定所述第一拼音对应的场景热词中被所述用户使用过的第三词汇的数量是否大于1;

若所述第三词汇的数量大于1,则确定所述第三词汇中使用次数最高或者热度最高的场景热词的差异值得分最高;

若所述第三词汇的数量等于1,则确定所述第三词汇的差异值得分最高;

若所述用户未使用过所述第一拼音对应的场景热词,则确定所述第一拼音对应的场景热词中热度最高的场景热词的差异值得分最高;

若所述第一拼音的数量等于1,则确定所述第一拼音对应的场景热词的差异值得分最高。

6.根据权利要求3所述的方法,其特征在于,所述确定所述用户的籍贯和/或生活地址之前,所述方法还包括:获取所述用户的普通话等级;

确定所述普通话等级未达到预设等级。

7.一种语音识别装置,其特征在于,应用于语音识别系统中的服务器,所述语音识别系统包括所述服务器和用户进行语音互动的终端设备,所述服务器包括支持人机语音交互的人机互动引擎,所述装置包括:获取单元,用于调用所述人机互动引擎通过所述终端设备与所述用户进行互动,获取所述互动过程中所述用户输入的目标语音信息;以及,对所述目标语音信息进行文字识别,得到第一文本;

场景识别单元,用于对所述第一文本进行场景识别,确定所述第一文本对应的目标服务场景,所述目标服务场景用于表征所述第一文本所表达的需要提供的服务类型;

场景关联词提取单元,用于对所述第一文本进行场景关联词提取,得到所述第一文本对应的目标场景关联词,所述目标场景关联词用于表征所述第一文本所表达的需要提供的所述服务类型的服务内容;

场景热词集合查询单元,用于根据所述目标服务场景进行场景热词集合查询,得到与所述目标服务场景对应的目标场景热词集合;

对比单元,用于将所述目标场景关联词与所述目标场景热词集合中的场景热词进行拼音对比,得到所述目标场景关联词与所述目标场景热词集合中的场景热词的差异值得分,所述场景热词为热度大于热度阈值的词汇,所述热度是指词汇在全部用户中的查询热度;

第一确定单元,用于确定所述目标场景热词集合中差异值得分最高的目标场景热词;

替换单元,用于用所述目标场景热词替换所述第一文本中的目标场景关联词,得到第二文本;

第二确定单元,用于根据所述第二文本确定所述目标语音信息所表达的用户意图;以及,服务单元,用于根据确定出的用户意图执行对应的服务操作;

在所述将所述目标场景关联词与所述目标场景热词集合中的场景热词进行拼音对比,得到所述目标场景关联词与所述目标场景热词集合中的场景热词的差异值得分方面,所述对比单元具体用于:确定所述目标场景热词集合中是否存在与所述目标场景关联词的拼音完全相同的第一词汇;

若存在,则确定所述第一词汇的数量是否大于1;

若是,则确定所述用户是否曾经针对所述第一词汇进行过查询;

若是,则确定所述第一词汇中被查询过的第二词汇的数量是否大于1;

若是,则确定所述用户针对每个所述第二词汇的查询时间与当前时间的时间间隔是否大于预设间隔;

若是,则确定所述第二词汇中查询次数最多的场景热词的差异值得分最高;

若否,则确定所述第二词汇中查询时间与当前时间的时间间隔最短的场景热词的差异值得分最高。

8.一种电子设备,其特征在于,包括处理器、存储器以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1‑6任一项所述方法中的步骤的指令。

9.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1‑6任一项所述方法的步骤。