1.一种隐式篇章关系识别方法,其特征在于,所述方法包括如下步骤:步骤一:接收编码器发送的全局语义关系向量以及局部语义关系向量,将所述全局语义关系向量作为GRU网络的第零个隐状态;
步骤二:将上一级对应的隐状态以及所有的所述局部语义关系向量,根据注意力机制计算得到当前级别篇章关系的局部语义关系信息;
步骤三:将上一级别的篇章关系向量与所述当前级别篇章关系对应的所述局部语义关系信息进行拼接后,输入至当前GRU单元,以计算得到当前级别的隐式篇章关系;
其中,所述计算得到当前级别篇章关系的局部语义关系信息的方法包括如下步骤:根据上一级对应的隐状态以及每个所述局部语义关系向量计算得到对应的权重分布;
根据所述权重分布以及每个所述局部语义关系向量计算得到所述当前级别篇章关系的局部语义关系信息;
其中,所述根据上一级对应的隐状态以及每个所述局部语义关系向量计算得到对应的权重分布的方法对应的公式表达式为:其中, 表示根据注意力机制计算得到的第 个权重分布, 表示第 级篇章关系的隐状态, 为注意力机制参数, 表示第 个局部语义关系向量,为局部语义关系向量的个数;
表示根据注意力机制计算得到的权重分布;
所述根据所述权重分布以及每个所述局部语义关系向量计算得到所述当前级别篇章关系的局部语义关系信息的方法对应的公式表达式为:其中, 表示第 级篇章关系的局部语义关系信息。
2.根据权利要求1所述的隐式篇章关系识别方法,其特征在于,在所述步骤三中,输入至所述当前GRU单元的数据表达式为:其中, 为当前GRU单元的输入, 为所预测的第 级篇章关系的向量表示, 表示第 级篇章关系的局部语义关系信息。
3.根据权利要求2所述的隐式篇章关系识别方法,其特征在于,在所述步骤三中,还存在如下关系式:其中, 表示第 个重置门, 表示第 个更新门, 均为GRU单元的矩阵参数,表示当前时刻的状态信息, 表示第 级篇章关系的隐状态, 。
4.根据权利要求3所述的隐式篇章关系识别方法,其特征在于,所述方法还包括如下步骤:根据第 级篇章关系的隐状态进行篇章关系分类,以得到第 级篇章关系预测结果;
对应的表达式为:
表示第 级篇章关系的预测结果,MLP为多层感知机,softmax为用于计算概率的归一化指数函数。
5.根据权利要求1所述的隐式篇章关系识别方法,其特征在于,在所述步骤一之前,所述方法还包括:计算所输入的第一语句与第二语句之间的词对相关性矩阵,根据所述词对相关性矩阵,从行和列两个方向分别进行归一化处理得到第一权重矩阵以及第二权重矩阵;
根据所述第一权重矩阵以及所述第二权重矩阵计算得到第一局部语义关系特征以及第二局部语义关系特征;
根据所述第一局部语义关系特征以及所述第二局部语义关系特征,提取得到所述全局语义关系向量。
6.根据权利要求5所述的隐式篇章关系识别方法,其特征在于,所述词对相关性矩阵、所述第一权重矩阵以及所述第二权重矩阵之间存在如下关系式:其中, 为所述词对相关性矩阵, 为所述第一权重矩阵, 为所述第二权重矩阵,为需要训练的参数矩阵, 为输入的第一语句, 为输入的第二语句;
所述第一局部语义关系特征、所述第二局部语义关系特征与所述第一权重矩阵以及所述第二权重矩阵之间存在如下关系:其中, 为第一加权求和矩阵, 为第二加权求和矩阵, 为所述第一局部语义关系特征, 为所述第二局部语义关系特征,“;”表示矩阵或向量的拼接操作, 和 为多层非线性前馈神经网络;
所述全局语义关系向量与所述第一局部语义关系特征以及所述第二局部语义关系特征之间存在如下关系:其中,为所述全局语义关系向量。
7.一种隐式篇章关系识别系统,包括相互之间进行数据传输的编码器以及解码器,其特征在于,所述解码器包括:数据接收模块,用于接收编码器发送的全局语义关系向量以及局部语义关系向量,将所述全局语义关系向量作为GRU网络的第零个隐状态;
第一处理模块,用于将上一级对应的隐状态以及所有的所述局部语义关系向量,根据注意力机制计算得到当前级别篇章关系的局部语义关系信息;
第二处理模块,用于将上一级别的篇章关系向量与所述当前级别篇章关系对应的所述局部语义关系信息进行拼接后,输入至当前GRU单元,以计算得到当前级别的隐式篇章关系;
所述第一处理模块用于:
根据上一级对应的隐状态以及每个所述局部语义关系向量计算得到对应的权重分布;
根据所述权重分布以及每个所述局部语义关系向量计算得到所述当前级别篇章关系的局部语义关系信息;
其中,所述根据上一级对应的隐状态以及每个所述局部语义关系向量计算得到对应的权重分布的公式表达式为:其中, 表示根据注意力机制计算得到的第i个权重分布, 表示第j-1级篇章关系的隐状态, 为注意力机制参数, 表示第i个局部语义关系向量,l为局部语义关系向量的个数;
所述根据所述权重分布以及每个所述局部语义关系向量计算得到所述当前级别篇章关系的局部语义关系信息的方法对应的公式表达式为:其中, 表示第j级篇章关系的局部语义关系信息。
8.一种可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现上述权利要求1至6任意一项所述的隐式篇章关系识别方法。