欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020108283292
申请人: 北京擎盾信息科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-12-19
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种语句的语义抽象化表示方法,其特征在于,所述方法包括:获取目标语句,并对目标语句进行预处理操作,得到处理后的语句,其中,所述预处理操作包括分词操作和词性标注操作;

从所述处理后的语句中提取多种特征,其中,所述特征包括以下至少一项:词语级别的特征、词性特征、依存特征和Bert获取到的词语的上下文相关特征;

对所述多种特征进行联合编码,以获取所述语句的最终向量;

对所述最终向量进行解码,以生成所述语句中不同词语之间的依赖关系;

根据所述不同词语之间的依赖关系生成所述语句对应的抽象语义图;

对所述多种特征进行联合编码,以获取所述语句的最终向量,包括:根据所述词语级别的特征、词性特征和Bert获取到的词语的上下文相关特征,确定所述语句中每个词语的密集向量、词性标注的密集向量和Bert向量;

对每个词语的密集向量、词性标注的密集向量和Bert向量进行拼接,得到每个词语对应的联合向量;

采用双向长短期记忆网络来学习每个词语的联合向量对应的上下文表示向量;

采用双向图卷积神经网络对所述每个词语的依存特征进行处理,以生成所述每个词语的依赖特征向量;

将所述每个词语对应的上下文表示向量和依赖特征向量进行拼接,得到每个词语的最终向量;

将每个词语的最终向量进行拼接得到所述语句的最终向量;

对所述最终向量进行解码,以生成所述语句中不同词语之间的依赖关系,包括:使用双仿射算法对所述每个词语的最终向量进行预测,生成所述每个词语对应的父节点位置标签;

使用多层感知机算法对所述词语的最终向量进行预测,生成所述每个词语对应的弧关系标签和是否保留标签。

2.根据权利要求1所述的方法,其特征在于,根据所述不同词语之间的依赖关系生成所述语句对应的抽象语义图,包括:根据每个词语的是否保留标签确定是否保留该词语;

对于保留下来的所有词语,根据对应的父节点位置标签和弧关系标签生成所述抽象语义图。

3.根据权利要求1所述的方法,其特征在于,使用双仿射算法对所述每个词语的最终向量进行预测,生成所述每个词语对应的父节点位置标签,包括:使用以下公式计算每个词语对应的父节点位置标签的值;

其中, 表示父节点位置标签的值,R表示所述语句的最终向量, 表示权重矩阵,表示偏置值, 表示第i个词语的最终向量。

4.一种语句的语义抽象化表示装置,其特征在于,所述装置包括:预处理模块,用于获取目标语句,并对目标语句进行预处理操作,得到处理后的语句,其中,所述预处理操作包括分词操作和词性标注操作;

特征提取模块,用于从所述处理后的语句中提取多种特征,其中,所述特征包括以下至少一项:词语级别的特征、词性特征、依存特征和Bert获取到的词语的上下文相关特征;

编码模块,用于对所述多种特征进行联合编码,以获取所述语句的最终向量;

解码模块,用于对所述最终向量进行解码,以生成所述语句中不同词语之间的依赖关系;

生成模块,用于根据所述不同词语之间的依赖关系生成所述语句对应的抽象语义图;

所述编码模块包括:

第一确定单元,用于根据所述词语级别的特征、词性特征和Bert获取到的词语的上下文相关特征,确定所述语句中每个词语的密集向量、词性标注的密集向量和Bert向量;

第一拼接单元,用于对每个词语的密集向量、词性标注的密集向量和Bert向量进行拼接,得到每个词语对应的联合向量;

学习单元,用于采用双向长短期记忆网络来学习每个词语的联合向量对应的上下文表示向量;

处理单元,用于采用双向图卷积神经网络对所述每个词语的依存特征进行处理,以生成所述每个词语的依赖特征向量;

第二拼接单元,用于将所述每个词语对应的上下文表示向量和依赖特征向量进行拼接,得到每个词语的最终向量;

第三拼接单元,用于将每个词语的最终向量进行拼接得到所述语句的最终向量;

所述解码模块包括:

第一生成单元,用于使用双仿射算法对所述每个词语的最终向量进行预测,生成所述每个词语对应的父节点位置标签;

第二生成单元,用于使用多层感知机算法对所述词语的最终向量进行预测,生成所述每个词语对应的弧关系标签和是否保留标签。

5.根据权利要求4所述的装置,其特征在于,所述生成模块包括:第二确定单元,用于根据每个词语的是否保留标签确定是否保留该词语;

第三生成单元,用于对于保留下来的所有词语,根据对应的父节点位置标签和弧关系标签生成所述抽象语义图。

6.根据权利要求4所述的装置,其特征在于,所述第一生成单元用于:使用以下公式计算每个词语对应的父节点位置标签的值;

其中, 表示父节点位置标签的值,R表示所述语句的最终向量, 表示权重矩阵,表示偏置值, 表示第i个词语的最终向量。