1.一种基于多模态信息融合的用户人格特征预测方法,其特征在于:包括如下步骤:Step1:在社交媒体中收集用户标记为偏好的偏好图像以及对应评论,同时利用心理学调查问卷得到用户数值化的人格特征;将用户的人格特征、偏好图像和对应评论作为训练样本,收集M个用户的训练样本构成训练数据集;
Step2:将用户的偏好图像分别输入到基于卷积神经网络的物体识别模型fo(θo)和场景识别模型fs(θs)中,得到偏好图像的物体特征和场景特征,将对应评论输入到循环神经网络模型中,得到对应评论的文本特征;
Step3:构建基于注意力机制的多模态融合模型,对用户的物体特征、场景特征和文本特征进行特征融合,得到注意力特征图;
n n n
对用户A关于偏好图像x的物体特征 场景特征Fs 和文本特征H进行特征融合,包括如下步骤:
n n n
Step31:将文本特征H转化为对应物体特征 和场景特征Fs的卷积核K:其中:Wk和bk分别表示特征映射的权重和偏置;
n n
Step32:通过卷积核K分别对物体特征 和场景特征Fs进行卷积运算:n
其中:卷积核K与物体特征 和场景特征 具有相同的通道数量, 为文本特征引导下的物体特征, 为文本特征引导下的场景特征;
n
Step33:计算用户A关于偏好图像x的注意力特征图:其中: 表示注意力特征图 中位置(x,y)处的数值, 为文本特征引导下的融合物体特征和场景特征的注意力特征图;
Step4:利用深度回归网络对用户所有偏好图像的注意力特征图和人格特征进行建模训练,得到用户人格特征预测模型fR(θR);
Step5:收集待测试用户的偏好图像以及对应评论,将偏好图像以及对应评论输入到用户人格特征预测模型fR(θR)中,预测该用户的人格特征。
2.根据权利要求1所述的基于多模态信息融合的用户人格特征预测方法,其特征在于:n
所述Step2中,对于某一用户A,共收集到N幅偏好图像,第n幅偏好图像记为x (n=1,2,n
3,…,N),第n幅偏好图像的对应评论记为w (n=1,2,3,…,N);通过如下步骤获得用户A关n n
于偏好图像x的物体特征 场景特征 和文本特征H:n
Step21:将偏好图像x 输入到物体识别模型fo(θo)中,得到 θo为物体识别模型fo(θo)的系统参数;
n
Step22:将偏好图像x 输入到场景识别模型fs(θs)中,得到 θs为场景识别模型fs(θs)的系统参数;
n
Step23:将对应评论w输入到循环神经网络模型中,得到 GRU(·)为基n n
于门控循环单元的循环神经网络模型的函数, 为对应评论w中的第l个词语,对应评论wn n
的长度为L,l=1,2,3,…,L。
3.根据权利要求1所述的基于多模态信息融合的用户人格特征预测方法,其特征在于:所述Step4中,利用深度回归网络对用户A所有偏好图像的注意力特征图 和人格特征pm进行建模训练,包括如下步骤:
Step41:深度回归网络由全局平均池化层和一个多层感知机组成,多层感知机由两个全连接层组成,全局平均池化层用于把注意力特征图转化为相应的一维特征向量,多层感知机用于输出用户的人格特征预测值,即将某一用户所有偏好图像的注意力特征图映射为该用户的人格特征预测值;深度回归网络的输入为某一用户的注意力特征图、输出为该用户的人格特征预测值,采用Tanh函数作为激活函数;
Step42:使用用户的注意力特征图和人格特征对深度回归网络进行监督训练,采用损失函数L优化深度回归网络的参数:其中: 表示欧式距离,M为训练数据集中用户的数量,N为每位用户的偏好图像的数量, 为用户的人格特征预测值,pm为利用心理学调查问卷得到用户数值化的人格特征;通过随机梯度下降方法对深度回归网络的参数进行更新,最终得到用户人格特征预测模型fR(θR)。
4.一种实现权利要求1~3所述的任一基于多模态信息融合的用户人格特征预测方法的装置,其特征在于:包括多模态数据获取单元、用户人格特征获取单元、多模态特征提取单元、多模态特征融合单元、深度回归模型训练单元和用户人格特征预测单元:所述多模态数据获取单元,用于在社交媒体中收集大量用户标记为偏好的偏好图像以及对应评论;
所述用户人格特征获取单元,利用心理学调查问卷得到用户数值化的人格特征;
所述多模态特征提取单元,将用户的偏好图像作为输入,提取偏好图像中的物体特征和场景特征;将用户的对应评论作为输入,提取对应评论中的文本特征;
所述多模态特征融合单元,构建基于注意力机制的多模态融合模型,对用户的物体特征、场景特征和文本特征进行特征融合,得到注意力特征图;
所述深度回归模型训练单元,利用深度回归网络对用户所有偏好图像的注意力特征图和人格特征进行建模训练;
所述用户人格特征预测单元,收集待测试用户的偏好图像以及对应评论,将偏好图像以及对应评论输入到用户人格特征预测模型中,预测该用户的人格特征。
5.根据权利要求4所述的装置,其特征在于:所述多模态特征提取单元包括图像特征提取模块和文本特征提取模块;所述图像特征提取模块将用户的偏好图像分别输入到基于卷积神经网络的物体识别模型和场景识别模型中,得到偏好图像的物体特征和场景特征;所述文本特征提取模块将用户的对应评论输入到基于门控循环单元的循环神经网络模型中,得到对应评论的文本特征。
6.根据权利要求4所述的装置,其特征在于:所述多模态特征融合单元包括特征引导模块和特征融合模块;所述特征引导模块,利用用户对应评论的文本特征对物体特征和场景特征进行引导学习,得到文本特征引导下的物体特征和场景特征;所述特征融合模块,对文本特征引导下的物体特征和场景特征进行融合,得到偏好图像上基于对应评论的注意力特征图。
7.根据权利要求4所述的装置,其特征在于:所述深度回归模型训练单元包括网络构建模块和网络训练模块;所述网络构建模块用于构建深度回归网络,输入为用户的注意力特征图,输出为该用户的人格特征预测值;所述网络训练模块对使用用户的注意力特征图和人格特征对深度回归网络进行监督训练,优化深度回归网络的参数,得到用户人格特征预测模型。