欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2022106532444
申请人: 青岛理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-10-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种舆情信息内容挖掘与传播监控的分析方法,其特征在于,所述方法包括:

获取上一次舆情信息;根据上一次舆情信息,识别上一次舆情事件的正负面;分析上一次舆情事件发生的因素,所述分析上一次舆情事件发生的因素,具体包括:上一次舆情事件发生的关联事件分析,上一次舆情事件发生的关联时间分析,根据上一次舆情事件发生关联函数,计算上一次舆情事件发生关联度;基于上一次舆情事件的发生因素,分析上一次舆情事件再现的传播程度,所述基于上一次舆情事件的发生因素,分析上一次舆情事件再现的传播程度,具体包括:基于关联事件的数量,分析上一次舆情事件再现的热度,根据舆情事件热度函数,计算上一次舆情事件热度,预测上一次舆情事件再现的焦点;根据上一次舆情事件再现的传播程度,挖掘上一次舆情事件报道相关自媒体;预测相关自媒体对于上一次舆情事件再现的态度;根据自媒体的态度预测结果,对可能引发舆情危机的自媒体进行备案认证;

其中,所述分析上一次舆情事件发生的因素,包括:

根据识别的上一次舆情事件的正负面,分析上一次舆情事件发生的因素;所述因素包括关联事件与关联时间;所述关联事件是指导致上一次舆情事件发生的事件;所述关联时间是指导致上一次舆情事件发生的时间周期;通过上一次舆情事件发生关联函数,计算上一次舆情事件发生关联度,分析其发生的因素;包括:上一次舆情事件发生的关联事件分析;上一次舆情事件发生的关联时间分析;根据上一次舆情事件发生关联函数,计算上一次舆情事件发生关联度;

所述上一次舆情事件发生的关联事件分析,具体包括:

通过舆情关联事件分析系统对上一次舆情事件发生的关联事件进行分析;所述舆情关联事件分析系统包括预处理模块、拓扑模块和专家模块;所述预处理模块,用于对上一次舆情事件进行文本的预处理;所述文本的预处理,是指划分文本的关键词作为子信息,包括地点、事物和状态;所述拓扑模块,用于将预处理模块的子信息分类到不同的层上,然后分别对同一层的子信息及不同层的子信息进行拓扑,基于上一次舆情事件的信息生成多种类型的子信息;所述专家模块,是根据所述拓扑模块生成的多种类型的子信息,在互联网大数据库中爬取包含相同子信息的文本,将浏览量与互动量之和超过第二预设阈值的文本对应的内容作为关联事件,并生成分析报告;

所述上一次舆情事件发生的关联时间分析,具体包括:

所述关联时间分析是对时间周期进行分析;首先预设数据粒度;所述数据粒度是指对上一次舆情事件的数据细化的程度;根据所述数据粒度划分时间间隔,绘制时间间隔分布图,横坐标为时间,纵坐标为关联事件发生指标,若关联事件在所述时间间隔内发生,则所述时间间隔分布图的纵坐标值为1,否则为0;若在预设时间周期内,时间间隔分布图中预设时间间隔内出现纵坐标值为1,则上一次舆情事件与时间周期关联,该纵坐标值在时间间隔分布图对应的横坐标值即为所述关联时间;

所述根据上一次舆情事件发生关联函数,计算上一次舆情事件发生关联度,具体包括:

建立上一次舆情事件发生关联函数,即R=Sr*W1+Tr*W2;其中,R表示上一次舆情事件发生关联度;Sr表示关联事件数量;Tr表示关联时间数量;W1和W2分别表示对应的权重,且W1+W2=1;

其中,所述基于上一次舆情事件的发生因素,分析上一次舆情事件再现的传播程度,包括:

所述传播程度,通过上一次舆情事件再现的热度及上一次舆情事件再现的焦点来衡量;所述热度是指上一次舆情事件再现的火热程度,反映上一次舆情事件再现受大众的关注度;所述焦点是指上一次舆情事件再现时大众争论的集中点;根据分析的上一次舆情事件再现的热度及上一次舆情事件再现的焦点,建立舆情事件再现的传播程度评价体系,即SPR=(HOT+FOC)/2;其中,SPR表示上一次舆情事件再现的传播程度评价指标;HOT表示上一次舆情事件再现的热度评价指标,若上一次舆情事件再现的热度超过第三预设阈值,则HOT=1,否则HOT=0;FOC表示上一次舆情事件再现的焦点评价指标,若上一次舆情事件再现的焦点的关键词在爬取的大数据词库中出现的概率大于第四预设阈值,则FOC=1,否则,FOC=0;根据BP神经网络分析上一次舆情事件再现的传播程度;根据舆情事件热度函数以及焦点预测模型确定训练样本与测试样本,所述训练样本用于神经网络训练,所述测试样本用于检测实际值与预测值的相对误差;包括:基于关联事件的数量,分析上一次舆情事件再现的热度;根据舆情事件热度函数,计算上一次舆情事件热度;预测上一次舆情事件再现的焦点;

所述基于关联事件的数量,分析上一次舆情事件再现的热度,具体包括:

基于关联事件的数量,对上一次舆情事件再现的热度进行分析;若关联事件越多,关联事件总关注度和上一次舆情事件总关注度越高,则上一次舆情事件热度越高,所述上一次舆情事件再现的热度也越高;根据关联事件总关注度和舆情事件热度函数计算得到的上一次舆情事件热度作为原始数据,建立ARIMA回归模型:以时间顺序绘制关联事件总关注度与上一次舆情事件热度的变化曲线;若曲线不平稳,则对曲线对应的序列进行差分,并画出差分折线图确定阶数d;然后继续绘制差分折线图的自相关函数图与偏自相关函数图,根据图的形状分别判定模型的阶数p、q;最后根据ARIMA(p,d,q)输出曲线,读取时间往后移动后的预测值,即为所述上一次舆情事件再现的热度;

所述根据舆情事件热度函数,计算上一次舆情事件热度,具体包括:

建立舆情事件热度函数,即Hpr=Sr*Ca1+Ca2;其中,Hpr表示上一次舆情事件热度;Sr表示关联事件数量;Ca1表示关联事件总关注度;所述关联事件总关注度,是指通过事件发布系统后台的统计数据中大众对于该关联事件的浏览量、点赞量、评论量和转发量之和;Ca2表示上一次舆情事件总关注度;所述上一次舆情事件总关注度,是指通过事件发布系统后台的统计数据中大众对于该上一次舆情事件的浏览量、点赞量、评论量和转发量之和;

所述预测上一次舆情事件再现的焦点,具体包括:

通过爬取互联网大数据获得历史所有的焦点,利用焦点预测模型,对上一次舆情事件再现的焦点进行预测;所述焦点预测模型内容如下:将所述历史所有的焦点作为样本数据,通过K-means聚类算法分析,根据历史所有的焦点的关键词选择多个质心;所述关键词是指在大数据中出现的频率大于第五预设阈值的词语;然后计算各个样本到质心的欧氏距离,将各个样本分别归类到离其最近的质心;然后将每个类别的样本数据取平均值,求出每个类别的新质心;最后迭代进行样本归类和求新质心,直到聚类收敛,新旧质心不再变化为止;将所述上一次舆情事件与所述关联事件作为参数输入,通过聚类算法归类到与其最相似的焦点的关键词类型作为算法输出;最后根据焦点的关键词与所述上一次舆情事件,分析得到上一次舆情事件再现的焦点;

其中,所述根据上一次舆情事件再现的传播程度,挖掘上一次舆情事件报道相关自媒体,包括:

基于上一次舆情事件再现的传播程度,对上一次舆情事件报道的相关自媒体的类型和数量进行挖掘;所述相关自媒体包括:图文类自媒体、视频类自媒体、音频类自媒体与直播类自媒体;对上一次舆情事件报道的相关自媒体越多,上一次舆情事件热度就越高,上一次舆情事件再现的传播程度越大;利用关联规则挖掘Apriori算法挖掘相关自媒体对应上一次舆情事件再现的传播程度间的关联关系;所述关联规则算法过程如下:通过迭代输入,检索出网络大数据平台中相关自媒体的类型,数量两个因子中的所有频繁项集,即支持度不低于设定阈值的项集;所述支持度,是各个因子项集在大数据平台中出现的次数占各自的总项集次数的百分比;然后利用频繁项集构造出满足置信度的规则;所述置信度,是各个因子的总项集占数据库所有项集的百分比;通过对比支持度与置信度,判断与上一次舆情事件再现的传播程度关联性的强弱,并根据关联规则绘制上一次舆情事件再现的传播程度关联网络图;所述上一次舆情事件再现的传播程度关联网络图表明对上一次舆情事件报道的相关自媒体;

其中,所述预测相关自媒体对于上一次舆情事件再现的态度,包括:

基于深度学习方法建立相关自媒体态度预测模型,对相关自媒体对于上一次舆情事件再现的态度进行预测;首先收集大量的相关自媒体的舆情影响力,包括自媒体知名度、自媒体平台活跃度、自媒体影响力和上一次舆情事件的影响;所述自媒体知名度是指自媒体的粉丝数量,粉丝数量越多,自媒体知名度越高;所述自媒体平台活跃度包括自媒体平台上发布所有舆情事件的频率和发布总数;所述自媒体影响力,包括自媒体报道所有舆情事件后的点赞量、转发量和评论量;所述上一次舆情事件的影响,是指自媒体本身对于上一次舆情事件的积极影响或消极影响;所述积极影响通过上一次舆情事件报道后的点赞量衡量,点赞量越多,积极影响越大;所述消极影响通过上一次舆情事件报道后举报量来衡量,举报量越多,消极影响越大;通过爬虫爬取互联网大数据平台的所述相关自媒体的舆情影响力的内容数据,包括自媒体的粉丝数量,自媒体平台上发布所有舆情事件的频率和发布总数,自媒体报道所有舆情事件后的点赞量,转发量和评论量,以及上一次舆情事件报道后的点赞量,举报量;将所述相关自媒体的舆情影响力的内容数据划分为训练集和测试集;然后对上一次舆情事件报道后的点赞量,举报量进行预处理,将点赞量大于举报量且数值上超过第六预设阈值的,判定为积极影响作为预处理结果;将举报量大于点赞量且数值上超过第七预设阈值的,判定为消极影响作为预处理结果;将自媒体知名度,自媒体平台活跃度,自媒体影响力作为特征,预处理结果作为标签来训练相关自媒体态度预测神经网络模型,判断相关自媒体对于上一次舆情事件再现的态度,并且将判断结果按照预设格式记录到表格文件中返回给系统;最后利用测试集的数据来不断调整模型的参数,提高相关自媒体态度预测模型的准确性。

2.根据权利要求1所述的方法,其中,所述获取上一次舆情信息,包括:

基于互联网舆情信息获取上一次舆情信息,包括:获取预设条件;所述预设条件包括预设时间、预设领域、预设地点和预设事物中的至少一种;基于所述预设条件,采用舆情计算分析方法获取所述上一次舆情信息;基于所述预设条件,采用舆情计算分析方法获取所述上一次舆情信息,包括:根据所述预设条件,通过爬虫从互联网数据库中爬取与所述预设条件相同的至少一个第一信息;至少一个所述第一信息为一个时,将所述第一信息确定为所述上一次舆情信息;或者,至少一个所述第一信息为多个时,则爬取多个所述第一信息的浏览量,从多个所述第一信息筛选出浏览量最高的至少一个第二信息;至少一个所述第二信息为一个时,将所述第二信息确定为所述上一次舆情信息,或者,至少一个所述第二信息为多个时,则爬取多个所述第二信息的互动量,将多个所述第二信息中互动量最高的第二信息确定为所述上一次舆情信息;所述互动量是指信息包含的点赞量和评论回复量之和。

3.根据权利要求1所述的方法,其中,所述根据上一次舆情信息,识别上一次舆情事件的正负面,包括:

所述识别上一次舆情事件的正负面,是指将所述上一次舆情信息的正负极性进行分类,方法如下:首先,对所述上一次舆情信息进行特征提取,让计算机系统分辨出表达真实的主观信息的文本内容;所述特征提取,是指计算机通过对信息文本检测,并查阅标准词库,将带有主观信息所在的段落句子筛选出来;所述主观信息,是指带有情感色彩及正负面倾向性的词语;然后,基于所述带有主观信息所在的段落句子,进一步提取该段落句子所表达的意见,选择一方对特定主题的观点,包括:主题提取,观点持有者识别以及陈述的选择;所述主题提取,是指提取带有评述性的观点以及表述的主题的具体方面;所述观点持有者识别,是指确定持有所述评述性的观点的人;所述陈述的选择,是指鉴别观点持有者发布的意见,并去除其他人的陈述;接着,以历史所有舆情事件为样本,基于影响因子构建单分类SVM模型;所述影响因子包括提取的主题,观点持有者的陈述;然后利用激活函数,将单分类SVM模型的中间输出的样本到超球面球心的距离的取值区间映射至[0,1];若映射结果等于第一预设阈值,则上一次舆情事件的极性是中立的;若映射结果小于第一预设阈值,则上一次舆情事件的极性与历史舆情事件的极性相反;否则,上一次舆情事件的极性与历史舆情事件的极性相同。

4.根据权利要求1所述的方法,其中,所述根据自媒体的态度预测结果,对可能引发舆情危机的自媒体进行备案认证,包括:

所述舆情危机,是指自媒体发布不良言论引起在社会的消极影响;自媒体备案认证包括数据处理模块,神经网络模型构建模块与自媒体预警生成模块;根据自媒体的态度预测结果,对可能引发舆情危机的自媒体进行备案认证,包括:根据自媒体上一次舆情事件报道后的举报量判断是否需要进行不良言论认证;若所述举报量高于第八预设阈值,则确定需要进行不良言论认证,将自媒体报道的上一次舆情信息认证为所述不良言论;通过所述数据处理模块获取上一次舆情事件的内容数据,以及利用深度学习RNN算法分析所述举报量与相关自媒体对于舆情事件再现的态度预测结果,找出所述不良言论,构建不良言论向量;通过所述神经网络模型构建模块利用所述不良言论向量构建并训练卷积神经网络模型;通过所述自媒体预警生成模块利用训练好的卷积神经模型进行预警,实现对可能引发舆情危机的自媒体进行备案认证。