欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2018107073232
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种句子的情感极性分析方法,其特征在于,包括:

利用机器学习模型对句子的情感极性进行分析,得到表示所述句子的情感极性的结果向量,所述机器学习模型包括决策树模型、分类器模型、卷积神经网络模型和循环神经网络模型中至少两种;

利用逻辑回归模型拟合所述结果向量,得到所述句子的情感极性;

在利用机器学习模型对句子的情感极性进行分析之前,所述方法还包括:利用词语分析模型对情感词进行扩容以建立情感词典,所述词语分析模型包括点间互信息;

使用所述情感词典训练所述机器学习模型;

其中,利用词语分析模型对情感词进行扩容,包括:基于给定词语与褒义基准词组的点间互信息和所述给定词语与贬义基准词组的点间互信息之间的差值,利用所述差值计算所述给定词语的情感倾向,基于所述情感倾向对所述情感词进行扩容。

2.根据权利要求1所述的方法,其特征在于,所述词语分析模型还包括词向量和实体识别程序中至少一种。

3.根据权利要求2所述的方法,其特征在于,所述决策树模型包括梯度提升决策树模型,使用所述情感词典训练所述机器学习模型,包括:针对句子的词性特征和/或词性交叉特征构建所述梯度提升决策树模型,并使用所述情感词典训练所述梯度提升决策树模型。

4.根据权利要求2或3所述的方法,其特征在于,所述分类器模型包括快速文本分类器模型,使用所述情感词典训练所述机器学习模型,还包括:针对句子的N‑Gram特征构建所述快速文本分类器模型,并使用所述情感词典训练所述快速文本分类器模型。

5.根据权利要求2所述的方法,其特征在于,使用所述情感词典训练所述机器学习模型,还包括:针对句子的语义特征构建所述卷积神经网络模型,并使用所述情感词典训练所述卷积神经网络模型。

6.根据权利要求5所述的方法,其特征在于,使用所述情感词典训练所述卷积神经网络模型,包括:将用词向量模型训练的词向量作为输入,增加预训练词向量通道。

7.根据权利要求2或3所述的方法,其特征在于,使用所述情感词典训练所述机器学习模型,还包括:在所述循环神经网络模型中采用注意力机制,针对句子的语义特征,对长句子构建所述循环神经网络模型,并使用所述情感词典训练所述循环神经网络模型。

8.一种句子的情感极性分析装置,其特征在于,包括:

极性分析单元,用于利用机器学习模型对句子的情感极性进行分析,得到表示所述句子的情感极性的结果向量,所述机器学习模型包括决策树模型、分类器模型、卷积神经网络模型和循环神经网络模型中至少两种;

结果拟合单元,用于利用逻辑回归模型拟合所述结果向量,得到所述句子的情感极性;

情感词扩容单元,用于:利用词语分析模型对情感词进行扩容以建立情感词典,所述词语分析模型包括点间互信息、词向量和实体识别程序中至少一种;

模型训练单元,用于:使用所述情感词典训练所述机器学习模型;

其中,利用词语分析模型对情感词进行扩容,包括:基于给定词语与褒义基准词组的点间互信息和所述给定词语与贬义基准词组的点间互信息之间的差值,利用所述差值计算所述给定词语的情感倾向,基于所述情感倾向对所述情感词进行扩容。

9.根据权利要求8所述的装置,其特征在于,所述词语分析模型还包括词向量和实体识别程序中至少一种。

10.根据权利要求9所述的装置,其特征在于,所述决策树模型包括梯度提升决策树模型,所述模型训练单元包括第一子单元,所述第一子单元用于:针对句子的词性特征和/或词性交叉特征构建所述梯度提升决策树模型,并使用所述情感词典训练所述梯度提升决策树模型。

11.根据权利要求9或10所述的装置,其特征在于,所述分类器模型包括快速文本分类器模型,所述模型训练单元包括第二子单元,所述第二子单元用于:针对句子的N‑Gram特征构建所述快速文本分类器模型,并使用所述情感词典训练所述快速文本分类器模型。

12.根据权利要求9所述的装置,其特征在于,所述模型训练单元包括第三子单元,所述第三子单元用于:针对句子的语义特征构建所述卷积神经网络模型,并使用所述情感词典训练所述卷积神经网络模型。

13.根据权利要求12所述的装置,其特征在于,所述第三子单元还用于:将用词向量模型训练的词向量作为输入,增加预训练词向量通道。

14.根据权利要求9或10所述的装置,其特征在于,所述模型训练单元包括第四子单元,所述第四子单元用于:在所述循环神经网络模型中采用注意力机制,针对句子的语义特征,对长句子构建所述循环神经网络模型,并使用所述情感词典训练所述循环神经网络模型。

15.一种句子的情感极性分析装置,其特征在于,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1‑7中任一所述的方法。

16.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑7中任一所述的方法。