欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2023112583556
申请人: 南通话时代信息科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-02-06
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.用于企业会议的数据智能存储方法,其特征在于,所述方法包括:交互获得目标会议视音频数据,其中,所述目标会议视音频数据通过对目标企业会议进行视音频同步收录获得,所述目标企业会议共有K个参会人员,K为正整数;

生成K个参会声纹特征,其中,所述K个参会声纹特征通过对目标会议视音频数据进行视音频同步分析获得,所述K个参会声纹特征与所述K个参会人员一一映射;

对所述目标会议视音频数据进行音轨提取,获得目标音频数据;

获得K组参会音频,其中,所述K组参会音频通过使用所述K个参会声纹特征对所述目标音频数据进行声音源分离获得;

预设标准声量阈值,并采用所述标准声量阈值对所述K组参会音频进行声量统一化处理,获得K组声量统一化音频;

获得目标存储音频数据,其中,所述目标存储音频数据通过对所述K组声量统一化音频进行时序还原获得;

获得目标存储文本数据,其中,所述目标存储文本数据通过对所述目标存储音频数据进行文本化处理获得;

预设会议数据查阅权限,并根据所述会议数据查阅权限将所述目标存储音频数据和所述目标存储文本数据存储至目标企业云空间;

其中,生成K个参会声纹特征,其中,所述K个参会声纹特征通过对目标会议视音频数据进行视音频同步分析获得,所述K个参会声纹特征与所述K个参会人员一一映射,所述方法还包括:预设会议音频采集节点,并基于所述会议音频采集节点对所述目标音频数据进行音频采集,获得M段局部音频数据,其中,所述M段局部音频数据具有M个局部音频采集节点,M为正整数;

预设声纹特征提取规则,并基于所述声纹特征提取规则遍历所述M段局部音频数据,获得M组声纹特征参数;

对所述M组声纹特征参数进行聚合处理,获得N种参会声纹特征和N个特征采集节点,其中,N为小于等于K的正整数;

判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员,包括:判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员;

若所述N种参会声纹特征的特征数量不满足所述K个参会人员,则基于所述会议音频采集节点对所述目标音频数据进行二次音频采集,获得M段第二局部音频数据,其中,所述M段第二局部音频数据具有M个第二局部音频采集节点;

基于所述声纹特征提取规则遍历所述M段第二局部音频数据,获得M组第二声纹特征参数;

对所述M组声纹特征参数和所述M组第二声纹特征参数进行聚合处理,获得H种参会声纹特征和H个特征采集节点,其中,H为小于等于K的正整数;

判断所述H种参会声纹特征的特征数量是否满足所述K个参会人员;

以此类推,基于所述会议音频采集节点对所述目标音频数据进行多轮次音频采集和声纹特征分析,直至参会声纹特征的特征数量满足所述目标企业会议的参会人员数量;

若所述N种参会声纹特征的特征数量满足所述K个参会人员,则基于所述N个特征采集节点在所述目标会议视音频数据中提取获得N个会议视频信息;

对所述N个会议视频信息进行行为特征分析,定位获得N个发言参会人员;

对所述N个发言参会人员进行身份识别,并构建参会人员身份和所述N种参会声纹特征之间的关联映射,获得所述K个参会声纹特征。

2.如权利要求1所述的方法,其特征在于,所述方法还包括:预构建声纹特征识别子网络,其中,所述声纹特征识别子网络包括声纹特征识别模块、音频拆分执行模块和参会音频存储模块;

其中,所述参会音频存储模块包括K个参会音频存储空间;

根据所述K个参会声纹特征与所述K个参会人员的映射关系,获得K组声纹特征‑参会人员;

将声纹特征作为第一属性,将所述K个参会声纹特征作为第一属性值,将参会人员作为第二属性,将所述K个参会人员作为第二属性值,并以所述K组声纹特征‑参会人员为构建数据,基于知识图谱构建所述声纹特征识别模块。

3.如权利要求2所述的方法,其特征在于,获得K组参会音频,其中,所述K组参会音频通过使用所述K个参会声纹特征对所述目标音频数据进行声音源分离获得,所述方法还包括:将所述目标音频数据输入所述声纹特征识别子网络后,基于所述声纹特征识别模块进行参会人员分析,获得第一分析结果和第一发言时段;

所述音频拆分执行模块根据所述第一发言时段对所述目标音频数据进行声音源同步分离,获得第一参会音频段;

所述参会音频存储模块根据所述第一分析结果在所述K个参会音频存储空间中对应调用第一参会音频存储空间,并将所述第一参会音频段存储至所述第一参会音频存储空间;

所述声纹特征识别模块以所述第一发言时段为起点对所述目标音频数据进行参会人员分析,获得第二分析结果和第二发言时段;

所述音频拆分执行模块根据所述第二发言时段对所述目标音频数据进行声音源同步分离,获得第二参会音频段;

所述参会音频存储模块根据所述第二分析结果在所述K个参会音频存储空间中对应调用第二参会音频存储空间,并将所述第二参会音频段存储至所述第二参会音频存储空间;

以此类推,完成对所述目标音频数据的声音源分离,并通过对所述K个参会音频存储空间进行音频提取,输出所述K组参会音频。

4.如权利要求1所述的方法,其特征在于,预设标准声量阈值,并采用所述标准声量阈值对所述K组参会音频进行声量统一化处理,获得K组声量统一化音频,所述方法还包括:对所述K组参会音频进行声量计算,获得K组参会声量值;

对所述K组参会声量值进行均值计算,获得K个整体声量指标;

交互获得所述目标企业会议中所述K个参会人员的K个参会座次信息;

交互获得录制所述目标会议视音频数据的目标设备位置参数;

根据所述K个参会座次信息和所述目标设备位置参数进行声量收录分析,获得K个声量指标权重;

生成所述标准声量阈值,其中,所述标准声量阈值根据所述K个整体声量指标和所述K个声量指标权重计算获得;

基于所述标准声量阈值遍历所述K组参会声量值进行音频片段的逐段调整,获得所述K组声量统一化音频。

5.如权利要求1所述的方法,其特征在于,预设会议数据查阅权限,并根据所述会议数据查阅权限将所述目标存储音频数据和所述目标存储文本数据存储至目标企业云空间,所述方法还包括:获得目标企业的目标组织人员架构;

基于所述K个参会人员遍历所述目标组织人员架构,获得X级组织架构等级;

根据所述X级组织架构等级对所述K个参会人员设定角色控制访问,生成所述会议数据查阅权限;

根据所述会议数据查阅权限将所述目标存储音频数据和所述目标存储文本数据存储至目标企业云空间。

6.用于企业会议的数据智能存储装置,其特征在于,所述装置包括:会议数据交互模块,用于交互获得目标会议视音频数据,其中,所述目标会议视音频数据通过对目标企业会议进行视音频同步收录获得,所述目标企业会议共有K个参会人员,K为正整数;

声纹特征生成模块,用于生成K个参会声纹特征,其中,所述K个参会声纹特征通过对目标会议视音频数据进行视音频同步分析获得,所述K个参会声纹特征与所述K个参会人员一一映射;

音轨提取执行模块,用于对所述目标会议视音频数据进行音轨提取,获得目标音频数据;

参会音频拆分模块,用于获得K组参会音频,其中,所述K组参会音频通过使用所述K个参会声纹特征对所述目标音频数据进行声音源分离获得;

声量处理执行模块,用于预设标准声量阈值,并采用所述标准声量阈值对所述K组参会音频进行声量统一化处理,获得K组声量统一化音频;

存储音频生成模块,用于获得目标存储音频数据,其中,所述目标存储音频数据通过对所述K组声量统一化音频进行时序还原获得;

存储文本获得模块,用于获得目标存储文本数据,其中,所述目标存储文本数据通过对所述目标存储音频数据进行文本化处理获得;

查阅权限设定模块,用于预设会议数据查阅权限,并根据所述会议数据查阅权限将所述目标存储音频数据和所述目标存储文本数据存储至目标企业云空间;

其中,所述声纹特征生成模块还用于:

预设会议音频采集节点,并基于所述会议音频采集节点对所述目标音频数据进行音频采集,获得M段局部音频数据,其中,所述M段局部音频数据具有M个局部音频采集节点,M为正整数;

预设声纹特征提取规则,并基于所述声纹特征提取规则遍历所述M段局部音频数据,获得M组声纹特征参数;

对所述M组声纹特征参数进行聚合处理,获得N种参会声纹特征和N个特征采集节点,其中,N为小于等于K的正整数;

判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员,包括:判断所述N种参会声纹特征的特征数量是否满足所述K个参会人员;

若所述N种参会声纹特征的特征数量不满足所述K个参会人员,则基于所述会议音频采集节点对所述目标音频数据进行二次音频采集,获得M段第二局部音频数据,其中,所述M段第二局部音频数据具有M个第二局部音频采集节点;

基于所述声纹特征提取规则遍历所述M段第二局部音频数据,获得M组第二声纹特征参数;

对所述M组声纹特征参数和所述M组第二声纹特征参数进行聚合处理,获得H种参会声纹特征和H个特征采集节点,其中,H为小于等于K的正整数;

判断所述H种参会声纹特征的特征数量是否满足所述K个参会人员;

以此类推,基于所述会议音频采集节点对所述目标音频数据进行多轮次音频采集和声纹特征分析,直至参会声纹特征的特征数量满足所述目标企业会议的参会人员数量;

若所述N种参会声纹特征的特征数量满足所述K个参会人员,则基于所述N个特征采集节点在所述目标会议视音频数据中提取获得N个会议视频信息;

对所述N个会议视频信息进行行为特征分析,定位获得N个发言参会人员;

对所述N个发言参会人员进行身份识别,并构建参会人员身份和所述N种参会声纹特征之间的关联映射,获得所述K个参会声纹特征。