欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2022115684357
申请人: 北京国联视讯信息技术股份有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于人工智能的用户数据分析方法,其特征在于,应用于服务器,所述服务器与至少一个终端设备通信连接,所述终端设备被配置成响应于用户的操作生成文本信息,所述文本信息构成用户话题文本数据集,所述方法包括:获取所述用户话题文本数据集的基础文本知识字段,所述基础文本知识字段为所述话题文本数据的特征向量;

对所述用户话题文本数据集的基础文本知识字段进行转化操作,得到所述用户话题文本数据集的对比文本知识字段,其中,所述转化操作包括:基于第一pooling单元对所述用户话题文本数据集的基础文本知识字段进行池化得到基础文本知识字段的池化结果pooling‑1;基于第一regularization单元对所述池化结果pooling‑1进行规范化得到基础文本知识字段的规范化结果;基于第一FCL单元对所述规范化结果进行分类映射得到所述对比文本知识字段;

对所述用户话题文本数据集的基础文本知识字段进行数值转换操作,获得对应于所述用户话题文本数据集的对比数值字段,其中,所述数值转换操作包括:基于第二pooling单元对所述用户话题文本数据集的基础文本知识字段进行池化得到基础文本知识字段的池化结果pooling‑2;基于第二regularization单元对所述池化结果pooling‑2进行规范化,得到基础文本知识字段的规范化结果;基于第二FCL单元对所述规范化结果进行分类映射,得到所述对比数值字段;

对所述用户话题文本数据集的对比数值字段进行归一化操作,得到所述用户话题文本数据集的对比数值字段的第一匹配数组;

基于所述用户话题文本数据集的对比文本知识字段以及所述用户话题文本数据集的第一匹配数组对多个对比话题文本数据集进行共性匹配处理,得到与所述用户话题文本数据集匹配的对比话题文本数据集,所述对比话题文本数据集为标注有情绪极性的话题文本数据集;

将所述对比话题文本数据集标注的情绪极性作为所述用户话题文本数据集的情绪极性;

所述用户话题文本数据集的对比文本知识字段以及所述用户话题文本数据集的对比数值字段是基于提取话题文本分析网络得到的,在获取用户话题文本数据集的基础文本知识字段之前,所述方法还包括所述话题文本分析网络的调试过程,包括:基于所述话题文本分析网络对预设话题文本数据集样本进行文本知识字段挖掘,得到所述预设话题文本数据集样本的对比文本知识字段以及所述预设话题文本数据集样本的对比数值字段;

基于所述预设话题文本数据集样本的对比文本知识字段进行代价指标值获取,得到所述预设话题文本数据集样本的文本知识字段空间代价指标值,所述文本知识字段空间代价指标值为文本知识字段之间的距离代价指标值,其中,所述基于所述预设话题文本数据集样本的对比文本知识字段进行代价指标值获取,得到所述预设话题文本数据集样本的文本知识字段空间代价指标值,包括:确定所述话题文本数据集对比样本的对比文本知识字段与所述话题文本数据集正样本的对比文本知识字段之间的第一对比文本知识字段间隔值,然后获取所述话题文本数据集对比样本的对比文本知识字段与所述话题文本数据集负样本的对比文本知识字段之间的第二对比文本知识字段间隔值;获取所述第一对比文本知识字段间隔值与第一预设代价指标值的第一作和结果,然后获取所述第一作和结果与所述第二对比文本知识字段间隔值之间的第一作差结果;若所述第一作差结果为正数结果,将所述第一作差结果确定为所述文本知识字段空间代价指标值;若所述第一作差结果不为正数结果,将零值确定为所述文本知识字段空间代价指标值;

基于所述预设话题文本数据集样本的对比数值字段进行代价指标值获取,得到所述预设话题文本数据集样本的数值字段空间代价指标值和数值字段代价指标值,具体包括:获取所述话题文本数据集对比样本的对比数值字段与所述话题文本数据集正样本的对比数值字段之间的第一对比数值字段间隔值,然后获取所述话题文本数据集对比样本的对比数值字段与所述话题文本数据集负样本的对比数值字段之间的第二对比数值字段间隔值;确定所述第一对比数值字段间隔值与第二预设代价指标值的第二作和结果,然后获取所述第二作和结果与所述第二对比数值字段间隔值之间的第二作差结果;若所述第二作差结果为正数结果,将所述第二作差结果确定为所述数值字段空间代价指标值;若所述第二作差结果不为正数结果,将零值确定为所述数值字段空间代价指标值;对所述话题文本数据集对比样本、所述话题文本数据集正样本以及所述话题文本数据集负样本分别对应的对比数值字段进行调试归一化操作,得到每个所述对比数值字段中的各个字段对应的调试数值;确定每个所述对比数值字段中的各个字段与对应的调试数值的预设计算结果;将和每一所述字段对应的所述预设计算结果相加,得到所述预设话题文本数据集样本的数值字段代价指标值;

对所述预设话题文本数据集样本的文本知识字段空间代价指标值、数值字段空间代价指标值及数值字段代价指标值中的多个进行整合操作,并将整合操作得到的代价指标值确定为对应所述话题文本分析网络的第一代价指标值,所述代价指标值用于评估所述话题文本分析网络输出结果的质量;

基于对应所述话题文本分析网络的第一代价指标值调试所述话题文本分析网络;

所述预设话题文本数据集样本包括话题文本数据集对比样本、话题文本数据集正样本以及话题文本数据集负样本,所述话题文本数据集正样本与所述话题文本数据集对比样本之间的共性度量结果大于第一预设共性度量结果,所述话题文本数据集负样本与所述话题文本数据集对比样本之间的共性度量结果小于第二预设共性度量结果,所述第一预设共性度量结果大于所述第二预设共性度量结果;

所述话题文本分析网络包括主干知识挖掘模块、对比知识转化模块、对比数值转换模块;

所述基于所述话题文本分析网络对预设话题文本数据集样本进行文本知识字段挖掘,得到所述预设话题文本数据集样本的对比文本知识字段以及所述预设话题文本数据集样本的对比数值字段,包括:基于所述主干知识挖掘模块分别对所述话题文本数据集对比样本、所述话题文本数据集正样本以及所述话题文本数据集负样本进行主干文本知识字段挖掘,得到所述话题文本数据集对比样本、所述话题文本数据集正样本以及所述话题文本数据集负样本分别对应的基础文本知识字段;

基于所述对比数值转换模块对所述话题文本数据集对比样本、所述话题文本数据集正样本以及所述话题文本数据集负样本的基础文本知识字段分别进行数值转化操作,得到所述话题文本数据集对比样本、所述话题文本数据集正样本以及所述话题文本数据集负样本分别对应的对比数值字段;

基于所述对比知识转化模块分别对所述话题文本数据集对比样本、所述话题文本数据集正样本以及所述话题文本数据集负样本的基础文本知识字段进行转化操作,得到所述话题文本数据集对比样本、所述话题文本数据集正样本以及所述话题文本数据集负样本分别对应的对比文本知识字段;

所述基于对应所述话题文本分析网络的第一代价指标值调试所述话题文本分析网络,包括:

若所述第一代价指标值是基于所述文本知识字段空间代价指标值、所述数值字段空间代价指标值以及所述数值字段代价指标值而获取,则基于所述第一代价指标值调节所述主干知识挖掘模块的网络系数、所述对比数值转换模块的网络系数以及所述对比知识转化模块的网络系数;或者;基于所述第一代价指标值调节所述对比数值转换模块的网络系数以及所述对比知识转化模块的网络系数;

若所述第一代价指标值是基于所述数值字段空间代价指标值以及所述数值字段代价指标值而获取,基于所述第一代价指标值调节所述对比数值转换模块的网络系数;

在获取用户话题文本数据集的基础文本知识字段之前,所述方法还包括:

调节所述主干知识挖掘模块的网络系数以及所述对比知识转化模块的网络系数直至对应所述话题文本分析网络的第二代价指标值满足预设条件;

调节所述主干知识挖掘模块的网络系数、所述对比数值转换模块的网络系数以及所述对比知识转化模块的网络系数直至对应所述话题文本分析网络的第三代价指标值满足所述预设条件。

2.根据权利要求1所述的方法,其特征在于,所述调节所述主干知识挖掘模块的网络系数以及所述对比知识转化模块的网络系数,包括:基于所述话题文本分析网络对预设话题文本数据集样本进行文本知识字段挖掘,得到所述预设话题文本数据集样本的对比文本知识字段;

基于所述预设话题文本数据集样本的对比文本知识字段进行代价指标值获取,得到所述预设话题文本数据集样本的文本知识字段空间代价指标值,并将所述文本知识字段空间代价指标值确定为对应所述话题文本分析网络的第二代价指标值;

基于对应所述话题文本分析网络的第二代价指标值调节所述主干知识挖掘模块的网络系数以及所述对比知识转化模块的网络系数。

3.根据权利要求1所述的方法,其特征在于,所述基于所述用户话题文本数据集的对比文本知识字段以及所述用户话题文本数据集的第一匹配数组对多个对比话题文本数据集进行共性匹配处理,得到与所述用户话题文本数据集匹配的对比话题文本数据集,包括:基于所述多个对比话题文本数据集的第二匹配数组,获取所述第二匹配数组与所述对比话题文本数据集之间的对应情况,其中,每个所述第二匹配数组与一个及以上的所述对比话题文本数据集对应;

基于所述第一匹配数组,在多个所述第二匹配数组中识别出锁定匹配数组,并将所述锁定匹配数组对应的对比话题文本数据集确定为匹配话题文本数据集;

获取所述锁定匹配数组对应的对比话题文本数据集的对比文本知识字段与所述用户话题文本数据集的对比文本知识字段之间的字段间隔,将所述字段间隔大于预设字段间隔的对比话题文本数据集确定为匹配话题文本数据集。

4.一种用户数据分析AI系统,其特征在于,包括相互通信的终端设备和服务器,所述服务器包括处理器和存储器,所述存储器存储有计算机程序,当所述处理器执行所述计算机程序时,执行如权利要求1 3任一项所述的基于人工智能的用户数据分析方法。

~