1.一种语音处理方法,用于对输入音频进行处理,其特征在于,包括:获取输入音频;
第一语音识别模型对输入音频进行识别,生成第一识别文本;
聊天机器人用于对识别文本进行语义理解,获取识别文本的语义信息,根据语义信息确定对输入音频的反馈;及根据对第一识别文本的语义理解程度,决定是否调用第二语音识别模型;
若聊天机器人对第一识别文本的语义理解程度未满足预设条件,聊天机器人将调用第二语音识别模型对输入音频进行识别,生成第二识别文本;
聊天机器人根据第一识别文本和第二识别文本确定输入音频的语义信息,进而确定第二预设反馈,并将第二预设反馈反馈至用户;
若聊天机器人调用第二语音识别模型,聊天机器人还根据第一识别 文本获取与第一识别文本相关联的第一回复,并将第一回复反馈至用户。
2.如权利要求1所述的一种语音处理方法,其特征在于,聊天机器人还根据第一识别文本获取与第一识别文本相关联的第一回复,还包括:预设有若干第一回复,预设有若干语义类型,第一回复与语义类型有预设的关联关系;
聊天机器人在对第一识别文本进行语义理解的过程中,获取第一识别文本的语义信息,并对第一识别文本中的语义信息进行分类,以获取第一识别文本中语义信息的语义类型;
根据语义类型,获取语义类型与关联的第一回复。
3.如权利要求1或2所述的一种语音处理方法,其特征在于,第一回复或第二预设反馈中包括中继话术,以承接第一回复和第二预设反馈。
4.如权利要求1‑2任一所述的一种语音处理方法,其特征在于,在根据对第一识别文本的语义理解程度,决定是否调用第二语音识别模型,包括:聊天机器人判断第一识别文本是否满足预设形式条件,若第一识别文本不满足预设形式条件,聊天机器人将调用第二语音识别模型。
5.如权利要求4所述的一种语音处理方法,其特征在于,在根据对第一识别文本的语义理解程度,决定是否调用第二语音识别模型,还包 括:聊天机器人可根据第一识别文本中的语义信息获得输入意图,若聊天机器人根据第一识别文本中的语义信息未获取到输入意图,聊天机器人将调用第二语音识别模型。
6.如权利要求5所述的一种语音处理方法,其特征在于,在根据对第一识别文本的语义理解程度,决定是否调用第二语音识别模型,还包括:聊天机器人可根据输入意图获取与输入意图相对应的第一预设反馈,若聊天机器人根据输入意图未能获取与输入意图相对应的第一预设反馈,聊天机器人将调用第二语音识别模型。
7.一种语音处理系统,包括第一语音识别模型、第二语音识别模型及聊天机器人;第一语音识别模型与聊天机器人连接,第二语音识别模型与聊天机器人连接;
第一语音识别模型用于对输入的音频进行识别,生成第一识别文本,并将第一识别文本发送至聊天机器人;
第二语音识别模型用于对输入的音频进行识别,生成第二识别文本,并将第二识别文本发送至聊天机器人;
聊天机器人用于对识别文本进行语义理解,确定对输入音频的反馈;及根据对第一识别文本的理解程度,决定是否调用第二语音识别模型;
若聊天机器人对第一识别文本的语义理解程度未满足预设条件,聊天机器人将调用第二语音识别模型对输入音频进行识别,生成第二识别文本;
聊天机器人还用于根据第一识别文本和第二识别文本确定输入音频的语义信息,进而确定第二预设反馈,并将第二预设反馈反馈至用户;
若聊天机器人调用第二语音识别模型,聊天机器人还用于根据第一识别文本获取与第一识别文本相关联的第一回复,并将第一回复反馈至用户。
8.一种计算机可读存储介质,用于存储计算机程序,其特征在于,计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现权利要求 1‑6中任一项所述的语音处理方法。