1.一种面向大数据处理的舆情信息识别方法,其特征在于:包括:采集舆情信息数据并进行预处理,构建多层级知识图谱;
利用图神经网络对所述多层级知识图谱进行学习,构建舆情信息识别模型;
利用所述舆情信息识别模型对舆情信息数据进行识别和分类;
制定反馈机制,对所述多层级知识图谱和所述舆情信息识别模型进行更新。
2.如权利要求1所述的面向大数据处理的舆情信息识别方法,其特征在于:所述舆情信息数据包括社交媒体信息和新闻报道;
所述构建多层级知识图谱包括以下步骤:
利用命名实体识别NER技术对预处理后的舆情信息数据进行信息提取;
将提取的信息进行整合,构建多层级知识图谱;
利用图数据库存储构建的多层级知识图谱;
所述实体识别包括人物、地点和组织;
所述多层级知识图谱包括基础信息层、实体关系层和主题层。
3.如权利要求2所述的面向大数据处理的舆情信息识别方法,其特征在于:所述构建舆情信息识别模型包括以下步骤:将构建的多层级知识图谱转换为图结构数据;
利用图卷积网络GCN模型对图结构数据进行学习,捕捉节点之间的语义关系,构建舆情信息识别模型;
所述舆情信息识别模型通过引入图注意力机制捕捉节点之间的联系,对多层级知识图谱的节点进行更新。
4.如权利要求3所述的面向大数据处理的舆情信息识别方法,其特征在于:所述图注意力机制的具体公式如下:其中,
所述对多层级知识图谱的节点进行更新的具体公式如下:其中,
5.如权利要求4所述的面向大数据处理的舆情信息识别方法,其特征在于:所述识别和分类包括情感分类和主题分类;
所述对舆情信息数据进行识别和分类包括以下步骤:采集待识别的舆情信息数据并进行预处理;
利用舆情信息识别模型对预处理后的舆情信息数据进行识别和分类,输出每个节点的概率分布;
计算舆情信息识别模型的损失函数;
将识别和分类的结果进行可视化;
所述每个节点的概率分布的具体公式如下:其中,P(y
6.如权利要求5所述的面向大数据处理的舆情信息识别方法,其特征在于:所述对预处理后的舆情信息数据进行识别和分类的具体情况如下:当节点属于情感类别时,若每个节点的概率分布大于等于第一阈值,则判定节点属于对应的情感类别;
当节点属于情感类别时,若每个节点的概率分布小于第一阈值,则判定节点不属于对应的情感类别;
当节点数据主题类别时,若每个节点的概率分布大于等于第二阈值,则判定节点属于对应主题类别;
当节点数据主题类别时,若每个节点的概率分布小于第二阈值,则判定节点不属于对应主题类别;
若每个节点的概率分布连续N次大于第一阈值或第二阈值,则提高对应阈值,降低对类别的敏感度;
若每个节点的概率分布连续N次小于第一阈值或第二阈值,则降低对应阈值,提高对类别的敏感度;
若每个节点的概率分布连续N次等于第一阈值或第二阈值,则保持对应阈值不变。
7.如权利要求6所述的面向大数据处理的舆情信息识别方法,其特征在于:所述损失函数的具体公式如下:其中,Loss为舆情信息识别模型的损失函数;N为数据集中的节点数;y
8.一种面向大数据处理的舆情信息识别系统,基于权利要求1~7任一所述的一种面向大数据处理的舆情信息识别方法,其特征在于:包括,知识图谱模块,用于采集舆情信息数据并利用命名实体识别NER技术进行信息提取,构建多层级知识图谱;
模型构建模块,用于利用图卷积网络GCN模型对多层级知识图谱进行学习,构建舆情信息识别模型;
类别判断模块,用于利用舆情信息识别模型对待识别的舆情信息数据进行识别和分类,判断舆情信息数据的类别;
模型优化模块,用于利用实时数据和用户反馈对模型进行优化。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1~7任一所述的一种面向大数据处理的舆情信息识别方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1~7任一所述的一种面向大数据处理的舆情信息识别方法的步骤。