知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

基于语音的用户性别年龄识别方法、装置及计算机设备

面议

专利号： 2020103459043

申请人：平安科技(深圳)有限公司

专利类型：发明专利

专利状态：已下证

专利领域：电通信技术

更新日期：2025-12-10

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于语音的用户性别年龄识别方法，其特征在于，包括：接收用户端发送的当前用户语音数据；

将所述当前用户语音数据进行预处理，得到预处理后语音数据；

将所述预处理后语音数据中每一帧语音数据进行短时平均幅度的提取、并将每一帧语音数据进行梅尔频率倒谱系数、及梅尔频率倒谱系数一阶差分的特征提取，得到与所述预处理后语音数据中每一帧语音数据对应的混合参数特征，以组成混合参数特征时间序列；

将所述混合参数特征时间序列输入至预先训练的高斯混合模型，得到与所述当前用户语音数据对应的当前用户分类结果；其中，所述当前用户分类结果包括性别参数和预估年龄参数；以及

调用预先存储的语音回复策略，获取在所述语音回复策略中与当前用户分类结果对应的当前语音回复数据，将所述当前语音回复数据发送至用户端。

2.根据权利要求1所述的基于语音的用户性别年龄识别方法，其特征在于，所述调用预先存储的语音回复策略，获取在所述语音回复策略中与当前用户分类结果对应的当前语音回复数据，将所述当前语音回复数据发送至用户端之后，还包括：通过预先训练的N‑gram模型对所述当前用户语音数据进行识别得到识别结果，获取所述识别结果中与用户识别码字段对应的用户身份唯一识别码。

3.根据权利要求2所述的基于语音的用户性别年龄识别方法，其特征在于，所述通过预先训练的N‑gram模型对所述当前用户语音数据进行识别得到识别结果，获取所述识别结果中与用户识别码字段对应的用户身份唯一识别码之后还包括：根据所述用户身份唯一识别码，获取与用户端对应的用户真实年龄值和用户真实性别取值，判断所述预估年龄参数的取值是否等于所述用户真实年龄值，且判断所述性别参数的取值是否等于所述用户真实性别取值；

若所述预估年龄参数的取值不等于所述用户真实年龄值，或者所述性别参数的取值不等于所述用户真实性别取值，将所述当前用户分类结果及所述当前用户语音数据存储至预先创建的第一存储区域。

4.根据权利要求1所述的基于语音的用户性别年龄识别方法，其特征在于，所述将所述当前用户语音数据进行预处理，得到预处理后语音数据，包括：调用预先存储的采样周期将所述当前用户语音数据进行采样，得到当前离散语音信号；

调用预先存储的一阶FIR高通数字滤波器对所述当前离散语音信号进行预加重，得到当前预加重语音信号；

调用预先存储的汉明窗对所述当前预加重语音信息进行加窗，得到加窗后语音数据；

调用预先存储的帧移和帧长对所述加窗后语音数据进行分帧，得到预处理后语音数据。

5.根据权利要求1所述的基于语音的用户性别年龄识别方法，其特征在于，所述将每一帧语音数据进行梅尔频率倒谱系数、及梅尔频率倒谱系数一阶差分的特征提取，包括：将所述预处理后语音数据依次进行傅里叶变换，得到频域语音数据；

将所述频域语音数据取绝对值，得到取绝对值后语音数据；

将所述取绝对值后语音数据通过梅尔滤波，得到梅尔滤波后语音数据；

将所述梅尔滤波后语音数据依次进行取对数运算和离散余弦变换，得到与所述预处理后语音数据对应的梅尔频率倒谱系数；

获取所述梅尔频率倒谱系数中连续相邻两项之差，以得到梅尔频率倒谱系数一阶差分。

6.根据权利要求1所述的基于语音的用户性别年龄识别方法，其特征在于，所述高斯混合模型中包括多个子高斯混合模型；其中，多个子高斯混合模型中的其中一个记为第一子高斯混合模型，所述第一子高斯混合模型为用于识别18‑20岁男性的识别模型；

所述将所述混合参数特征时间序列输入至预先训练的高斯混合模型，得到与所述当前用户语音数据对应的当前用户分类结果之前，还包括：获取第一样本数据；其中，第一样本数据中为多个18‑20岁男性的语音数据对应的混合参数特征时间序列；

通过第一样本数据对待训练第一子高斯混合模型进行训练，得到用于识别18‑20岁男性的第一子高斯混合模型；

将训练后的第一子高斯混合模型存储至区块链网络。

7.一种基于语音的用户性别年龄识别装置，其特征在于，包括：语音数据接收单元，用于接收用户端发送的当前用户语音数据；

语音预处理单元，用于将所述当前用户语音数据进行预处理，得到预处理后语音数据；

混合参数序列获取单元，用于将所述预处理后语音数据中每一帧语音数据进行短时平均幅度的提取、并将每一帧语音数据进行梅尔频率倒谱系数、及梅尔频率倒谱系数一阶差分的特征提取，得到与所述预处理后语音数据中每一帧语音数据对应的混合参数特征，以组成混合参数特征时间序列；

用户分类单元，用于将所述混合参数特征时间序列输入至预先训练的高斯混合模型，得到与所述当前用户语音数据对应的当前用户分类结果；其中，所述当前用户分类结果包括性别参数和预估年龄参数；以及回复数据发送单元，用于调用预先存储的语音回复策略，获取在所述语音回复策略中与当前用户分类结果对应的当前语音回复数据，将所述当前语音回复数据发送至用户端。

8.根据权利要求7所述的基于语音的用户性别年龄识别装置，其特征在于，所述语音预处理单元，包括：

语音数据采样单元，用于调用预先存储的采样周期将所述当前用户语音数据进行采样，得到当前离散语音信号；

预加重单元，用于调用预先存储的一阶FIR高通数字滤波器对所述当前离散语音信号进行预加重，得到当前预加重语音信号；

加窗单元，用于调用预先存储的汉明窗对所述当前预加重语音信息进行加窗，得到加窗后语音数据；

分帧单元，用于调用预先存储的帧移和帧长对所述加窗后语音数据进行分帧，得到预处理后语音数据。

9.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的基于语音的用户性别年龄识别方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至6任一项所述的基于语音的用户性别年龄识别方法。