1.一种句子情感分析方法,其特征在于,包括以下步骤:
获得待分析句子以及预设的句子情感分析模型,其中,所述待分析句子包括若干个单词,所述句子情感分析模型包括编码模块、语义提取模块、句法提取模块以及情感分析模块;
将所述待分析句子输入至所述编码模块,获得句子级别特征表示以及单词级别特征表示;
构建所述待分析句子的句法关系邻接矩阵以及句法标签得分邻接矩阵,其中,所述句法关系邻接矩阵包括若干个单词之间的依存关系向量,所述句法标签得分邻接矩阵包括若干个单词之间的依存类型得分向量;
将所述单词级别特征表示输入至所述语义提取模块,构建语义邻接矩阵,其中,所述语义邻接矩阵包括若干个单词之间的语义权重特征向量;
将所述单词级别特征表示、语义邻接矩阵、句法关系邻接矩阵以及句法标签得分邻接矩阵、输入至所述句法提取模块,获得句法特征表示;
将所述句法特征表示以及句子级别特征表示输入至所述情感分析模块,获得所述待分析句子的情感分析结果。
2.根据权利要求1所述的句子情感分析方法,其特征在于,所述构建所述待分析句子的句法关系邻接矩阵以及句法标签得分邻接矩阵,包括步骤:构建所述待分析句子的依存图,其中,所述依存图包括若干个单词对应的节点;
获得所述待分析句子的依存关系信息以及依存类型信息,其中,所述依存关系信息用于指示所述待分析句子中单词与单词之间的依存关系,所述依存类型信息用于指示所述待分析句子中单词与单词的依存类型;
根据所述待分析句子的依存关系信息以及依存类型标签信息,分别将所述待分析句子的依存图转化为句法关系邻接矩阵以及句法类型邻接矩阵,根据所述句法类型邻接矩阵以及预设的矩阵转换算法,获得所述句法标签得分邻接矩阵,其中,所述矩阵转换算法为:ALS=emb(AL)WLWS
式中,ALS为句法标签得分邻接矩阵,emb()为映射函数,AL为句法类型邻接矩阵,WL为第一权重参数矩阵,Ws为第二权重参数矩阵。
3.根据权利要求2所述的句子情感分析方法,其特征在于,所述将所述单词级别特征表示输入至所述语义提取模块,构建语义邻接矩阵,包括步骤:根据所述单词级别特征表示以及预设的多头自注意力算法,构建多头自注意力特征表示,其中,所述多头自注意力特征表示包括若干个注意力头的特征向量,所述多头自注意力算法为:式中,headi为第i个注意力头的注意力得分,HX为所述单词级别特征表示,为第i个注意力头的第一权重参数矩阵,为第i个注意力头的第二权重参数矩阵,T为转置符号,dhead为维度参数;
根据所述多头自注意力特征表示以及预设的语义邻接矩阵构建算法,构建所述语义邻接矩阵,其中,所述语义邻接矩阵构建算法为:AW=Norn(Concat(head1,head2,…,headh)·Whead)式中,AW为所述语义邻接矩阵,Norn()为归一化函数,Concat()为拼接函数,headh为第h个注意力头的注意力得分,Whead为所述语义提取模块的第三权重参数矩阵。
4.根据权利要求3所述的句子情感分析方法,其特征在于:所述句法提取模块包括多层图卷积网络;
所述将所述单词级别特征表示、语义邻接矩阵、句法关系邻接矩阵以及句法标签得分邻接矩阵、输入至所述句法提取模块,获得句法特征表示,包括步骤:根据所述语义邻接矩阵、句法关系邻接矩阵、句法标签得分邻接矩阵以及预设的矩阵融合算法,构建全局信息邻接矩阵,其中,所述全局信息邻接矩阵包括若干个单词之间的全局信息特征向量,所述矩阵融合算法为:AWL=AS⊙AW⊙ALS
式中,AWL为全局信息邻接矩阵,AS为句法关系邻接矩阵,ALS为句法标签得分邻接矩阵;
将所述单词级别特征表示以及全局信息邻接矩阵输入至所述多层图卷积网络,根据预设的句法特征算法,获得所述句法特征表示,其中,所述句法特征表示包括若干个单词的句法特征向量,所述句法特征算法为:式中,为所述多层图卷积网络的第l层输出的第i个单词的单词级别特征向量,σ()为激活函数,为第i个单词与第j个单词之间的全局信息特征向量,为所述多层图卷积网络的第l层的权重参数矩阵为所述多层图卷积网络的第l层输出的第j个单词的句法特征向量,为所述多层图卷积网络的第l层的偏置参数。
5.根据权利要求4所述的句子情感分析方法,其特征在于,所述将所述句法特征表示以及句子级别特征表示输入至所述情感分析模块,获得所述待分析句子的情感分析结果,包括步骤:对所述句法特征表示进行池化处理,获得池化处理后的句法特征表示,根据所述池化处理后的句法特征表示、句子级别特征表示以及预设的拼接算法,获得拼接特征表示,其中,所述拼接算法为:式中,为所述拼接特征表示,hout为所述池化处理后的句法特征表示,hcls为句子级别特征表示;
根据所述拼接特征表示以及预设的情感分析算法,获得情感分类极性概率分布向量,根据所述情感分类极性概率分布向量,获得概率最大的维度对应的情感极性,将所述情感极性作为所述待分析句子的情感分析结果,其中,所述情感分析算法为:式中,y为所述情感分类极性概率分布向量,softmax()为归一化激活函数,Wo为所述情感分析模块的权重参数矩阵,bo为所述情感分析模块的偏置参数。
6.根据权利要求5所述的句子情感分析方法,其特征在于,还包括步骤:训练所述句子情感分析模型,所述训练所述句子情感分析模型,包括步骤:获得训练句子集以及所述训练句子集的句子情感标签数据,其中,所述训练句子集包括若干个训练句子,所述训练句子包括样本句子以及所述样本句子相应的增强句子,所述样本句子以及增强句子均包括若干个单词;所述句子情感标签数据包括各个所述训练句子的情感极性;
将所述训练句子集输入至待训练的句子情感分析模型中的句子编码模块,获得若干个所述训练句子的句子级别特征表示以及单词级别特征表示;
根据所述句子情感标签数据,构建若干个所述训练句子的对比句子集,获得各个所述训练句子的对比句子集对应的句子级别特征表示集,其中,所述对比句子集包括若干个对比句子,所述对比句子为具有与所述训练句子相同情感极性的其他训练句子,所述句子级别特征表示集包括若干个所述对比句子的句子级别特征表示;
根据若干个所述训练句子的对比句子集对应的句子级别特征表示集以及预设的第一损失函数,对所述句子情感分析模型进行训练,其中,所述第一损失函数为:式中,LECL为第一损失值,2k为训练句子的数目,Pi为第i个训练句子的对比句子集,p表示对比句子集中的对比句子,k∈I/i,I为训练句子的索引集I=[1,2,…,2k],I/i表示除去I中第i个训练句子后的索引集,为第i个训练句子的句子级别特征表示,为对比句子集中第p个对比句子的句子级别特征表示,为对比句子集中第k个对比句子的句子级别特征表示,τ为第一温度系数。
7.根据权利要求6所述的句子情感分析方法,其特征在于,所述训练所述句子情感分析模型,包括步骤:构建各个所述训练句子的句法关系邻接矩阵以及句法类型邻接矩阵,根据各个所述训练句子的句法关系邻接矩阵中单词与单词之间的依存关系向量,获得若干个训练单词对,其中,所述训练单词对为具有依存关系的单词对;
根据各个所述训练句子的句法类型邻接矩阵中单词与单词之间的依存类型向量,构建各个所述训练单词对的对比单词对集,其中,所述对比单词对集包括若干个对比单词对,所述对比单词对为具有与所述训练单词对相同依存类型的其他训练单词对;
根据各个所述训练句子的单词级别特征表示,获得若干个所述训练单词对的单词级别特征表示,根据各个训练单词对的单词级别特征表示以及预设的语义特征算法,获得各个所述训练单词对的语义特征表示,其中,所述单词级别特征表示包括若干个单词的单词级别特征向量,所述语义特征算法为:式中,gi为第i个训练单词对的语义特征表示,X′i[1]、X′i[2]分别为第i个训练单词对中第一个、第二个单词的单词级别特征向量,为第三权重参数矩阵、第四权重参数矩阵以及第五权重参数矩阵,bcl为第二偏置参数;
根据各个所述训练单词对的语义特征表示,构建各个所述训练单词对的对比单词对集中各个所述对比单词对的语义特征表示,根据各个所述对比单词对的语义特征表示以及预设的第二损失函数,对所述句子情感分析模型进行训练,其中,所述第二损失函数为:式中,LLcl为第二损失值,K′为训练单词对的数目,Pi′为第i个训练单词对的对比单词对集,p′表示对比单词对集中的对比单词对,k′∈I′/i,I′为训练单词对的索引集I′=[1,2,…,K′],I′/i表示除去I′中第i个训练单词对后的索引集,gp′为对比单词对集中第p′个对比单词对的语义特征表示,gk′为对比单词对集中第k′个对比单词对的语义特征表示,τ′为第二温度系数。
8.一种句子情感分析装置,其特征在于,包括:
获取模块,用于获得待分析句子以及预设的句子情感分析模型,其中,所述待分析句子包括若干个单词,所述句子情感分析模型包括编码模块、语义提取模块、句法提取模块以及情感分析模块;
编码模块,用于将所述待分析句子输入至所述编码模块,获得句子级别特征表示以及单词级别特征表示;
矩阵构建模块,用于构建所述待分析句子的句法关系邻接矩阵以及句法标签得分邻接矩阵,其中,所述句法关系邻接矩阵包括若干个单词之间的依存关系向量,所述句法标签得分邻接矩阵包括若干个单词之间的依存类型得分向量;
语义提取模块,用于将所述单词级别特征表示输入至所述语义提取模块,构建语义邻接矩阵,其中,所述语义邻接矩阵包括若干个单词之间的语义权重特征向量;
句法提取模块,用于将所述单词级别特征表示、语义邻接矩阵、句法关系邻接矩阵以及句法标签得分邻接矩阵、输入至所述句法提取模块,获得句法特征表示;
情感分析模块,用于将所述句法特征表示以及句子级别特征表示输入至所述情感分析模块,获得所述待分析句子的情感分析结果。
9.一种计算机设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的句子情感分析方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的句子情感分析方法的步骤。