1.基于强化依赖图的方面情感分类方法,其特征在于,包括以下步骤:S1:获取待分类评论文本;
S2:学习待分类评论文本的方面词信息和句法依赖关系,并生成对应的强化依赖图;
S3:基于强化依赖图融合方面词信息与句法信息和远距离单词之间的依赖关系,然后计算每个上下文信息与方面词信息相关的注意力权重,并得到对应的文本最终表示;
S4:基于所述文本最终表示进行方面情感分类,并将对应的分类结果作为待分类评论文本的方面情感分类结果。
2.如权利要求1所述的基于强化依赖图的方面情感分类方法,其特征在于,步骤S2中,通过如下步骤生成强化依赖图:w
S201:对待分类评论文本X进行词嵌入,得到对应的词嵌入表示H;
w p p
S202:将词嵌入表示H与对应的词性矩阵E进行拼接,得到对应的词性表示H;
p c
S203:将词性表示H进行上下文信息融合,得到对应的上下文表示H;
c
S204:基于上下文表示H 将对应的依赖词 依赖关系r、被依赖词 和方面词表示拼接成为状态st;其中,状态st对应的动作表示为S205:基于深度强化学习得到的策略网络选择待分类评论文本X中各个单词对应的动作 并生成对应的强化依赖图。
3.如权利要求2所述的基于强化依赖图的方面情感分类方法,其特征在于:X={x1,…,xτ+1,…,xτ+m,…,xn};
策略网络表示为
强化依赖图的邻接矩阵表示为p
上述式中: |V |表示词性p的个数,dp表示词性p的维度,词性表示拼接操作; 表示策略网络中状态st选择动作 的概率;θ={w,b}表示可学习的参数,
4.如权利要求2所述的基于强化依赖图的方面情感分类方法,其特征在于,步骤S4中,得到待分类评论文本的方面情感分类结果后,计算对应的延迟奖励优化所述策略网络;
延迟奖励的计算公式为
式中:R表示延迟奖励;L表示所述策略网络损失函数的输出;n表示待分类评论文本的单词个数,每个单词具有正向与反向的关系,n′表示动作 为“删除”关系的个数;γ表示一个超参数。
5.如权利要求4所述的基于强化依赖图的方面情感分类方法,其特征在于:通过REINFORCE算法和梯度下降算法优化所述策略网络,并使得期望的延迟奖励最大化;
REINFORCE算法的公式如下:式中:J(θ)表示期望的延迟奖励;动作 由状态st唯一决定;p(st)=1;
最终,所述策略网络的梯度表示为:表示对参数θ求偏导。
6.如权利要求2所述的基于强化依赖图的方面情感分类方法,其特征在于:步骤S3中,通过如下步骤得到文本最终表示:c
S301:设置L层图注意力网络,将上下文表示H作为图注意力网络的输入,将强化依赖图作为图注意力网络的图结构,使用多头注意力机制融合邻居节点的信息并增强当前节点表L
示,得到对应的隐藏状态表示H;
L
S302:基于隐藏状态表示H遮掩非方面词的向量并使得方面词的向量保持不变,得到对应的方面特征表示
c
S303:基于方面特征表示 匹配上下文表示H中与方面词语义相关的重要特征,并基于检索的注意力机制计算每个单词与方面词相关的注意力权重at;
S304:对各个注意力权重at进行加权求和,得到对应的文本最终表示z。
7.如权利要求6所述的基于强化依赖图的方面情感分类方法,其特征在于:增强当前节点表示的计算公式为其中,
注意力权重的计算公式为 其中,文本最终表示为
上述式中: 表示节点i在l+1层的表示;||表示拼接操作;σ表示非线性激活lk
函数;Ni表示节点i的邻居节点集合; 表示第l层第k个注意力的归一化注意力系数;W 表示第l层第k个头的转换矩阵; eij表示节点i与节点j之间的注意力; 表示第l层第j个节点的表示;
8.如权利要求6所述的基于强化依赖图的方面情感分类方法,其特征在于:通过梯度下降算法优化所述图注意力网络;通过热启动和交替训练的方式训练所述图注意力网络。
9.如权利要求8所述的基于强化依赖图的方面情感分类方法,其特征在于,训练所述图注意力网络时:
使用原始的依赖树对图注意力网络的参数进行预训练,即热启动;
固定图注意力网络的参数,训练强化依赖图部分的参数,以期望得到对分类更有效的图结构,固定强化依赖图部分的参数,训练图注意力网络的参数,依次交替,最终得到图注意力网络和强化依赖图两者都最优的结果,即交替训练。
10.如权利要求6所述的基于强化依赖图的方面情感分类方法,其特征在于,步骤S4中,通过如下步骤进行方面情感分类:S401:将文本最终表示z输入至全连接层,再通过softmax层进行归一化,得到预测的情感分类标签概率分布
其中,
S402:将概率分布最高的情感分类标签作为对应待分类评论文本的方面情感分类结果;
上述式中: 表示预测的情感分类标签;dz为方面情感分类的类别数;
表示可学习参数, 表示偏差。