1.一种用户画像构建方法,其特征在于,包括以下步骤:建立已售产品目录;获取所述已售产品目录中每一种已售产品的产品画像;从每一种已售产品的产品画像中提取出对应的多个产品标签,得到已售产品标签集;
根据所述已售产品标签集搜索出多种关联产品,得到关联产品目录;所述关联产品目录中,每一种关联产品的产品画像与所述已售产品标签集具有一个或多个相同的产品标签;从每一种关联产品的产品画像中提取出对应的多个产品标签,得到关联产品标签集;
将所述已售产品标签集与所述关联产品标签集合并,得到产品标签合集;
对所述产品标签合集进行数据增强,得到产品标签全集;
提取所述产品标签全集中每一个产品标签的特征信息;根据特征信息对所述产品标签全集进行聚类,得到多个产品标签类;
对每一个产品标签类执行步骤A,得到每一个产品标签类的多个用户标签;
步骤A:提取产品标签类中每一个产品标签的功能属性,根据功能属性生成每一个产品标签对应的用户属性,对每一个用户属性进行文本情感分析,得到每一个产品标签对应的分析结果;提取每一个分析结果的特征信息,得到每一个产品标签对应的用户标签;
从每一个产品标签类中提取一个或多个用户标签;利用提取的用户标签构建用户画像。
2.根据权利要求1所述的一种用户画像构建方法,其特征在于,对每一个产品标签类执行步骤A之前,包括以下步骤:对每一个产品标签类进行语义信息增强,得到多个增强的产品标签类;
所述语义信息增强,包括以下步骤:
根据所述产品标签全集中每一个产品标签的特征信息,建立产品特征知识图谱;
抽取所述产品特征知识图谱的三元组信息;
采用BERT模型对所述三元组信息进行语义信息编码,得到所述产品特征知识图谱的融合语义向量;
利用BERT-whitnin模型对所述融合语义向量进行降维,得到降维后的融合语义向量;
对降维后的融合语义向量进行归一化处理,得到增强的产品标签类。
3.根据权利要求1或2所述的一种用户画像构建方法,其特征在于,对所述产品标签合集进行数据增强,包括以下步骤:利用k近邻算法获取所述产品标签合集中每一个产品标签的多个近邻产品标签,得到近邻产品标签集;
从所述近邻产品标签集中随机选取多个近邻产品标签;
在选取的多个近邻产品标签之间进行线性插值,得到多个新产品标签;
将多个新产品标签添加至所述产品标签合集中,得到所述产品标签全集。
4.根据权利要求1或2所述的一种用户画像构建方法,其特征在于,对每一个用户属性进行文本情感分析,包括以下步骤:提取多个用户属性的特征信息和情感极性标签,得到用户特征信息样本和情感极性标签样本;
将所述用户特征信息样本和所述情感极性标签样本合并,得到训练样本;
将所述训练样本输入SVM分类器进行模型训练,得到分类模型;
将每一个用户属性输入所述分类模型,得到每一个产品标签对应的分析结果。
5.一种用户画像构建系统,其特征在于,包括:
已售产品目录建立模块,用于建立已售产品目录;
产品画像获取模块,用于获取所述已售产品目录中每一种已售产品的产品画像;
第一产品标签提取模块,用于从每一种已售产品的产品画像中提取出对应的多个产品标签,得到已售产品标签集;
关联产品目录建立模块,用于根据所述已售产品标签集搜索出多种关联产品,得到关联产品目录;所述关联产品目录中,每一种关联产品的产品画像与所述已售产品标签集具有一个或多个相同的产品标签;
第二产品标签提取模块,用于从每一种关联产品的产品画像中提取出对应的多个产品标签,得到关联产品标签集;
标签集合并模块,用于将所述已售产品标签集与所述关联产品标签集合并,得到产品标签合集;
数据增强模块,用于对所述产品标签合集进行数据增强,得到产品标签全集;
第一特征信息提取模块,用于提取所述产品标签全集中每一个产品标签的特征信息;
聚类模块,用于根据特征信息对所述产品标签全集进行聚类,得到多个产品标签类;
功能属性提取模块,用于提取产品标签类中每一个产品标签的功能属性;
用户属性生成模块,用于根据功能属性生成每一个产品标签对应的用户属性;
情感分析模块,用于对每一个用户属性进行文本情感分析,得到每一个产品标签对应的分析结果;
第二特征信息提取模块,用于提取每一个分析结果的特征信息,得到每一个产品标签对应的用户标签;
用户标签提取模块,用于从每一个产品标签类中提取一个或多个用户标签;
用户画像生成模块,用于利用提取的用户标签构建用户画像。
6.根据权利要求5所述的一种用户画像构建系统,其特征在于,还包括:语义信息增强模块,用于对每一个产品标签类进行语义信息增强,得到多个增强的产品标签类;
所述语义信息增强模块包括:
知识图谱生成单元,用于根据所述产品标签全集中每一个产品标签的特征信息,建立产品特征知识图谱;
三元组抽取单元,用于抽取所述产品特征知识图谱的三元组信息;
语义信息编码单元,用于采用BERT模型对所述三元组信息进行语义信息编码,得到所述产品特征知识图谱的融合语义向量;
语义向量降维单元,用于利用BERT-whitnin模型对所述融合语义向量进行降维,得到降维后的融合语义向量;
归一化处理单元,用于对降维后的融合语义向量进行归一化处理,得到增强的产品标签类。
7.根据权利要求5或6所述的一种用户画像构建系统,其特征在于,所述数据增强模块包括:近邻标签生成单元,用于利用k近邻算法获取所述产品标签合集中每一个产品标签的多个近邻产品标签,得到近邻产品标签集;
标签抽取单元,用于从所述近邻产品标签集中随机选取多个近邻产品标签;
线性插值单元,用于在选取的多个近邻产品标签之间进行线性插值,得到多个新产品标签;
标签添加单元,用于将多个新产品标签添加至所述产品标签合集中,得到所述产品标签全集。
8.根据权利要求5或6所述的一种用户画像构建系统,其特征在于,所述情感分析模块包括:样本生成单元,用于提取多个用户属性的特征信息和情感极性标签,得到用户特征信息样本和情感极性标签样本;
样本合并单元,用于将所述用户特征信息样本和所述情感极性标签样本合并,得到训练样本;
模型训练单元,用于将所述训练样本输入SVM分类器进行模型训练,得到分类模型;
数据分析单元,用于将每一个用户属性输入所述分类模型,得到每一个产品标签对应的分析结果。
9.一种计算机设备,其特征在于,包括:存储器、处理器和收发器;所述存储器、所述处理器和所述收发器依次通信连接;所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序并执行如权利要求1~4中任意一项所述的一种用户画像构建方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行如权利要求1~4中任意一项所述的一种用户画像构建方法。