1.一种持续语音人机交互方法,其特征在于,包括以下步骤:接收用户输入的持续语音信号;
基于长语音切分技术ModelVad将所述持续语音信号切分为多个短语音;
基于动态语言模型对所述多个短语音进行识别,并为每个短语音生成对应的识别结果;
基于上下文语义解析技术对所述识别结果进行语义补全,并生成语义补全结果;以及基于Agent-Based对话管理技术生成所述语义补全结果对应的问答语句。
2.如权利要求1所述的方法,其特征在于,所述基于长语音切分技术ModelVad将所述持续语音信号切分为多个短语音,包括:根据预先建立的静音模型,利用深度学习算法对所述持续语音信号的每帧语音进行识别,以识别出静音语音;
以所述静音语音为切分点将所述持续语音信号切分为多个短语音。
3.如权利要求1所述的方法,其特征在于,所述基于动态语言模型对所述多个短语音进行识别,并为每个短语音生成对应的识别结果,包括:获取短语音的上下文信息;
根据所述上下文信息选择对应的动态语言模型对所述短语音进行解码,以生成所述识别结果。
4.如权利要求3所述的方法,其特征在于,所述根据所述上下文信息选择对应的动态语言模型对所述短语音进行解码,以生成所述识别结果,包括:解析所述短语音的语义信息;
当所述短语音的语义信息与所述上下文信息相关时,生成对应的识别结果;
当所述短语音的语义信息与所述上下文信息无关时,过滤所述短语音。
5.如权利要求1所述的方法,其特征在于,所述基于Agent-Based对话管理技术生成所述语义补全结果对应的问答语句,包括:获取知识库中的待选答案;
基于有限状态机FST从所述待选答案中选择与所述语义补全结果音对应的跳转概率最大的问答语句。
6.一种持续语音人机交互系统,其特征在于,包括:接收模块,用于接收用户输入的持续语音信号;
切分模块,用于基于长语音切分技术ModelVad将所述持续语音信号切分为多个短语音;
识别模块,用于基于动态语言模型对所述多个短语音进行识别,并为每个短语音生成对应的识别结果;
语义补全模块,用于基于上下文语义解析技术对所述识别结果进行语义补全,并生成语义补全结果;以及生成模块,用于基于Agent-Based对话管理技术生成所述语义补全结果对应的问答语句。
7.如权利要求6所述的系统,其特征在于,所述切分模块用于:根据预先建立的静音模型,利用深度学习算法对所述持续语音信号的每帧语音进行识别,以识别出静音语音;
以所述静音语音为切分点将所述持续语音信号切分为多个短语音。
8.如权利要求6所述的系统,其特征在于,所述识别模块,用于:获取短语音的上下文信息;
根据所述上下文信息选择对应的动态语言模型对所述短语音进行解码,以生成所述识别结果。
9.如权利要求8所述的系统,其特征在于,所述识别模块,用于:解析所述短语音的语义信息;
当所述短语音的语义信息与所述上下文信息相关时,生成对应的识别结果;
当所述短语音的语义信息与所述上下文信息无关时,过滤所述短语音。
10.如权利要求6所述的系统,其特征在于,所述生成模块,用于:获取知识库中的待选答案;
基于有限状态机FST从所述待选答案中选择与所述语义补全结果音对应的跳转概率最大的问答语句。