知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

一种唇语关键词检测方法、装置、设备及存储介质

￥38400

专利号： 2020108278538

申请人：华侨大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2024-01-05

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种唇语关键词检测方法，其特征在于，包括以下步骤：

通过DNN方法训练，得到一个二分类的DNN模型；

基于所述DNN模型，判断待检测的唇语视频中的每帧唇部图片的讲话状态，分离出所述唇语视频的讲话片段和非讲话片段；整个唇语视频分为8个状态：未知状态、讲话开始状态、讲话状态、讲话结束状态、非讲话开始状态、非讲话状态、非讲话结束状态、结束状态；

提取所述讲话片段，并通过唇语识别模型提取查询样例和讲话片段的每一帧唇部图片的特征，作为后验概率特征；所述唇语识别模型具体用于：通过三维卷积和二维Densenet提取唇部图片序列的视觉特征；通过resBi‑sLSTM解码所述视觉特征；通过CTC损失函数对解码视觉特征进行训练；

基于所述后验概率特征构建相似度矩阵图；其中，具体为：

将查询样例的后验概率特征与讲话片段的后验概率特征进行向量点积运算，取对数获得相似度矩阵图；其中，向量点积运算及取对数的过程为：其中，且，和分别代表查询样例和唇语片段的帧数，计算得到的相似度矩阵的值越高，则表示这两个向量之间的相似度越高；

通过卷积神经网络分类模型对所述相似度矩阵图进行二分类，判断唇语视频中是否存在关键词。

2.根据权利要求1所述的一种唇语关键词检测方法，其特征在于，还包括：在所述讲话开始状态之前和所述讲话结束状态之后，补一段非讲话帧，以防止判断过程中的误判。

3.根据权利要求1所述的一种唇语关键词检测方法，其特征在于，还包括：对所述相似度矩阵的值做归一化计算，使相似度矩阵中的所有值都处于区间内，计算过程如下：

4.根据权利要求1所述的一种唇语关键词检测方法，其特征在于，所述卷积神经网络分类模型具体用于：通过6层卷积、2层maxpool、自适应均值池化和全连接层构建；

通过负对数似然损失函数进行训练。

5.根据权利要求4所述的一种唇语关键词检测方法，其特征在于，所述负对数似然损失函数对softmax的输出概率取对数后的值进行损失函数计算，公式如下：其中，N代表N个数据，是真实标签对应的one‑hot编码，代表标签是第类，是softmax取对数后的输出。

6.一种唇语关键词检测装置，包括

训练模块，用于通过DNN方法训练，得到一个二分类的DNN模型；

分离模块，用于基于所述DNN模型，判断待检测的唇语视频中的每帧唇部图片的讲话状态，分离出所述唇语视频的讲话片段和非讲话片段；整个唇语视频分为8个状态：未知状态、讲话开始状态、讲话状态、讲话结束状态、非讲话开始状态、非讲话状态、非讲话结束状态、结束状态；

提取模块，用于提取所述讲话片段，并通过唇语识别模型提取查询样例和讲话片段的每一帧唇部图片的特征，作为后验概率特征；所述唇语识别模型具体用于：通过三维卷积和二维Densenet提取唇部图片序列的视觉特征；通过resBi‑sLSTM解码所述视觉特征；通过CTC损失函数对解码视觉特征进行训练；

构建模块，用于基于所述后验概率特征构建相似度矩阵图；将查询样例的后验概率特征与讲话片段的后验概率特征进行向量点积运算，取对数获得相似度矩阵图；其中，向量点积运算及取对数的过程为：其中，且，和分别代表查询样例和唇语片段的帧数，计算得到的相似度矩阵的值越高，则表示这两个向量之间的相似度越高；

分类模块，用于通过卷积神经网络分类模型对所述相似度矩阵图进行二分类，判断唇语视频中是否存在关键词。

7.一种唇语关键词检测设备，其特征在于，包括存储器以及处理器，所述存储器内存储有计算机程序，所述处理器用于运行所述计算机程序以实现如权利要求1‑5任意一项所述的一种唇语关键词检测方法。

8.一种存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序能够被所述存储介质所在设备的处理器执行，以实现如权利要求1‑5任意一项所述的一种唇语关键词检测方法。

推荐专利

一种关键词提取方法、终端、计算机可读存储介质

发明专利

￥28000

一种面向边缘计算的轻量级语音关键词识别方法

我要求购

我不想找了，帮我找吧

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

知嘟嘟

友情链接

关于我们

联系我们