欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2019109090025
申请人: 华东交通大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-19
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于条件随机场的隐式篇章关系识别方法,其特征在于,所述方法包括如下步骤:将接收到的语句进行编码以得到词向量序列,所述语句至少包括相关联的第一语句以及第二语句;

对所述词向量序列中所述第一语句与所述第二语句之间的篇章关系进行特征提取以得到多个不同级别的特征向量;

根据所述多个不同级别的特征向量,计算得到多个篇章关系分类对应的初步结果数据;

提供用于编码相邻篇章关系之间映射信息的转移矩阵,根据所述转移矩阵以及所述初步结果数据计算得到任一篇章关系序列得分,并根据所述篇章关系序列得分计算得到任一篇章关系序列对应的条件概率。

2.根据权利要求1所述的基于条件随机场的隐式篇章关系识别方法,其特征在于,所述将接收到的语句进行编码以得到词向量序列的方法包括如下步骤:将接收到的所述语句中的第i个词进行编码得到普通词向量 以及上下文敏感词向量其中所述普通词向量 为同一个词汇在每个语句中只用一个向量表示,所述上下文敏感词向量 为同一个词汇在不同的语句中由不同的向量表示。

3.根据权利要求2所述的基于条件随机场的隐式篇章关系识别方法,其特征在于,所述上下文敏感词向量 可表示为:所述第一语句表示为:

所述第二语句表示为:

其中,a=softmax(w)为正则化后的权重,w∈Rle为需要学习的权重参数, 分别为预训练好的上下文词敏感向量模型中le个隐层对应于语句中第i个词的输出,n为语句的最大设定长度,d为普通词向量和上下文敏感词向量的维度之和,所述第一语句 以及所述第二语句 为对应的词向量序列。

4.根据权利要求1所述的基于条件随机场的隐式篇章关系识别方法,其特征在于,对所述词向量序列中所述第一语句与所述第二语句之间的篇章关系进行特征提取以得到多个不同级别的特征向量的方法包括如下步骤:将编码后的所述第一语句以及所述第二语句作为输入,经神经网络建模后得到对应的第一编码器输出以及第二编码器输出;

根据所述第一编码器输出以及所述第二编码器输出计算得到相关性矩阵,根据所述第一编码器输出、所述第二编码器输出以及所述相关性矩阵计算得到所述多个不同级别的特征向量。

5.根据权利要求4所述的基于条件随机场的隐式篇章关系识别方法,其特征在于,经神经网络建模后得到的第i层第一编码器输出表示为:其中, Conva以及Convb为两个卷积操作,σ为

sigmoid函数,操作 代表向量按元素点乘。

6.根据权利要求5所述的基于条件随机场的隐式篇章关系识别方法,其特征在于,所述相关性矩阵表示为:其中,f为用于计算两个向量相关性的函数, 中的第j行表示所述第一语句中第j个单词与所述第二语句中每个单词的相关性权重, 中的第k行表示所述第二语句中第k个单词与所述第一语句中每个单词的相关性权重;

第i个特征层的特征向量表示为:

其中,oi为所述第i个特征层的特征向量,g为用于计算输出的函数。

7.根据权利要求1所述的基于条件随机场的隐式篇章关系识别方法,其特征在于,多个篇章关系分类对应的所述初步结果数据分别表示为:logits1=FFN1([o1;o2;...;oj]),logits2=FFN2([o1;o2;...;ok]),logits3=FFN3([o1;o2;...;ol]),其中,[o1;o2;...;oj]为特征抽取层1~j输出的特征层输出向量的拼接,FFN1用于计算第一级篇章关系分类的初步结果数据logits1,FFN2用于计算第二级篇章关系分类的初步结果数据logits2;FFN3用于计算第三级篇章关系分类的初步结果数据logits3。

8.根据权利要求1所述的基于条件随机场的隐式篇章关系识别方法,其特征在于,任一所述篇章关系序列得分表示为:其中, 分别将隐式篇章语句中的单词预测为第i个一级篇

章关系、第j个二级篇章关系以及第k个连接词的可能性,[M12]ij为第i个一级篇章关系到第j个二级篇章关系之间映射的可能性,[M23]jk为第j个二级篇章关系到第k个连接词篇章关系之间映射的可能性。

9.根据权利要求8所述的基于条件随机场的隐式篇章关系识别方法,其特征在于,任一篇章关系序列对应的所述条件概率表示为:其中, 为所述条件概率。

10.一种基于条件随机场的隐式篇章关系识别系统,其特征在于,所述系统包括:输入编码模块,用于将接收到的语句进行编码以得到词向量序列,所述语句至少包括相关联的第一语句以及第二语句;

特征抽取模块,用于对所述词向量序列中所述第一语句与所述第二语句之间的篇章关系进行特征提取以得到多个不同级别的特征向量;

分类计算模块,用于根据所述多个不同级别的特征向量,计算得到多个篇章关系分类对应的初步结果数据;

结果输出模块,用于提供用于编码相邻篇章关系之间映射信息的转移矩阵,根据所述转移矩阵以及所述初步结果数据计算得到任一篇章关系序列得分,并根据所述篇章关系序列得分计算得到任一篇章关系序列对应的条件概率。