欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2017109640651
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 核算装置
更新日期:2025-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种门禁控制方法,其特征在于,所述方法包括:采集声音信号;

对所述声音信号进行语音识别,得到识别结果,并判断所述识别结果是否与预设的关键词相匹配;

若匹配,对所述声音信号进行声纹识别,并确认所述声音信号对应的声音是否来源于目标用户;

如果是,开启门禁。

2.根据权利要求1所述的方法,其特征在于,在所述对所述声音信号进行语音识别之前,还包括:判断所述声音信号对应的声音是否为人声;

如果否,判断所述声音信号中是否存在用于表征目标事件的声音片段,其中,所述目标事件为:用于请求开启门禁的事件;

若存在,开启远程语音通话。

3.根据权利要求2所述的方法,其特征在于,所述判断所述声音信号中是否存在用于表征目标事件的声音片段的步骤,包括:判断所述声音信号中是否存在第一类型的声音片段,若存在,判定所述声音信号中存在用于表征目标事件的声音片段,其中,所述第一类型的声音片段为:在频域对应的频率信息中存在预设频率的声音片段;

和/或,

判断所述声音信号中第二类型的声音片段依次出现的频率是否在预设的频率范围内,若为是,判定所述声音信号中存在用于表征目标事件的声音片段,其中,所述第二类型的声音片段为:在频域对应的频率信息中存在预设峰值特征的声音片段。

4.根据权利要求1所述的方法,其特征在于,所述对所述声音信号进行语音识别之前,还包括:获得所述声音信号的基音频率和共振峰频率;

根据所述基音频率和共振峰频率,确定所述声音信号所对应声音的发出者的分类;

判断所述分类是否为预设分类;

如果是,拒绝开启门禁;

如果否,执行所述对所述声音信号进行语音识别的步骤。

5.根据权利要求4所述的方法,其特征在于,所述判断所述分类是否为预设分类的步骤之后,还包括:在判断所述分类是所述预设分类时,存储所述声音信号。

6.根据权利要求4所述的方法,其特征在于,所述共振峰频率为:所述声音信号在频域上功率谱的极大值对应的频率,频域信号是,对所述声音信号进行分帧处理得到的每一短时信号进行频域变换得到的。

7.根据权利要求1所述的方法,其特征在于,所述对所述声音信号进行语音识别,得到识别结果,并判断所述识别结果是否与预设的关键词相匹配,包括:提取所述声音信号的声音特征;

对所述声音特征进行解码,得到所述声音特征对应的文字;

判断所述文字与预设的关键词是否匹配。

8.根据权利要求7所述的方法,其特征在于,所述对所述声音信号进行声纹识别,并确认所述声音信号对应的声音是否来源于目标用户,包括:将所提取的声音特征与预先获得的目标用户的声音特征进行匹配;

若匹配,确定所述声音信号对应的声音来源于所述目标用户。

9.根据权利要求7所述的方法,其特征在于,所述对所述声音信号进行声纹识别,并确认所述声音信号对应的声音是否来源于目标用户,包括:将所提取的声音特征输入至预先训练的用户识别模型,获得所提取的声音特征对应的用户,其中,所述用户识别模型为:用于识别声音特征对应的用户的模型;

判断所获得的用户是否为目标用户,若为是,则判定所述声音信号对应的声音来源于所述目标用户。

10.根据权利要求1所述的方法,其特征在于,所述采集声音信号之后,还包括:利用以下公式计算所述声音信号的能量值:其中,n为所述声音信号中的信号点的数量, 为所述声音信号中第i个信号点对应的能量值;

判断计算所得到的能量值是否大于预设能量阈值;

如果大于,执行对所述声音信号进行语音识别的步骤。

11.一种门禁控制装置,其特征在于,所述装置包括:采集模块,用于采集声音信号;

语音识别模块,用于对所述声音信号进行语音识别,得到识别结果,并判断所述识别结果是否与预设的关键词相匹配;

声纹识别模块,用于当所述语音识别模块识别的结果为匹配时,对所述声音信号进行声纹识别,并确认所述声音信号对应的声音是否来源于目标用户;

门禁开启模块,用于所述声纹识别模块的识别结果为是时,开启门禁。

12.根据权利要求11所述的装置,其特征在于,所述装置还包括:第一判断模块,用于判断所述声音信号对应的声音是否为人声;

第二判断模块,用于所述第一判断模块的判断结果为否时,判断所述声音信号中是否存在用于表征目标事件的声音片段,其中,所述目标事件为:用于请求开启门禁的事件;

通话开启模块,用于所述第二判断模块的判断结果为是时,开启远程语音通话。

13.根据权利要求12所述的装置,其特征在于,所述第二判断模块包括:第一判断子模块,用于判断所述声音信号中是否存在第一类型的声音片段;

第一判定子模块,用于当所述第一判断子模块的判断结果为是时,判定所述声音信号中存在用于表征目标事件的声音片段,其中,所述第一类型的声音片段为:在频域对应的频率信息中存在预设频率的声音片段;

和/或,

第二判断子模块,用于判断所述声音信号中第二类型的声音片段依次出现的频率是否在预设的频率范围内;

第二判定子模块,用于当所述第二判断子模块的判断结果为是时,判定所述声音信号中存在用于表征目标事件的声音片段,其中,所述第二类型的声音片段为:在频域对应的频率信息中存在预设峰值特征的声音片段。

14.根据权利要求11所述的装置,其特征在于,所述装置还包括:获得模块,用于获得所述声音信号的基音频率和共振峰频率;

确定模块,用于根据所述基音频率和共振峰频率,确定所述声音信号所对应声音的发出者的分类;

第三判断模块,用于判断所述分类是否为预设分类;

拒绝开启模块,用于所述第三判断模块的判断结果为是时,拒绝开启门禁;

第一触发模块,用于所述第三判断模块的判断结果为否时,触发所述语音识别模块。

15.根据权利要求14所述的装置,其特征在于,所述装置还包括:存储模块,用于所述第三判断模块的判断结果为是时,存储所述声音信号。

16.根据权利要求14所述的装置,其特征在于,所述共振峰频率为:所述声音信号在频域上功率谱的极大值对应的频率,频域信号是,对所述声音信号进行分帧处理得到的每一短时信号进行频域变换得到的。

17.根据权利要求11所述的装置,其特征在于,所述语音识别模块包括:提取子模块,用于提取所述声音信号的声音特征;

解码子模块,用于对所述声音特征进行解码,得到所述声音特征对应的文字;

第三判断子模块,用于判断所述文字与预设的关键词是否匹配。

18.根据权利要求17所述的方法,其特征在于,所述声纹识别模块包括:匹配子模块,用于将所提取的声音特征与预先获得的目标用户的声音特征进行匹配;

确定子模块,用于所述匹配子模块的匹配结果为匹配时,确定所述声音信号对应的声音来源于所述目标用户。

19.根据权利要求17所述的装置,其特征在于,所述声纹识别模块包括:输入子模块,用于将所提取的声音特征输入至预先训练的用户识别模型,获得所提取的声音特征对应的用户,其中,所述用户识别模型为:用于识别声音特征对应的用户的模型;

第四判断子模块,用于判断所获得的用户是否为目标用户;

第三判定子模块,用于当所述第四判断子模块的判断结果为是时,判定所述声音信号对应的声音来源于所述目标用户。

20.根据权利要求11所述的装置,其特征在于,所述装置还包括:计算模块,用于利用以下公式计算所述声音信号的能量值:其中,n为所述声音信号中的信号点的数量, 为所述声音信号中第i个信号点对应的能量值;

第四判断模块,用于判断计算所得到的能量值是否大于预设能量阈值;

第二触发模块,用于所述第四判断模块的判断结果为是时,触发所述语音识别模块。

21.一种电子设备,其特征在于,包括处理器和存储器,其中,存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现权利要求1-10任一所述的方法步骤。

我要求购
我不想找了,帮我找吧
您有专利需要变现?
我要出售
智能匹配需求,快速出售