欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018105259294
申请人: 东北电力大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于多极情感分析的用户行为预测系统,其特征是,它包括:用于采集网络数据并进行分类管理,进而构建系统数据库的数据采集及数据库管理模块;基于分词词典将每个课时的文本语段进行分词处理,并将参与观看情况、参与评论情况、参与问答情况、私信教师情况和私信其他用户情况五项用户行为表示为时间序列,从而合并运算构建用户参与度时间序列的数据预处理模块;基于多种词性词典对分词处理后的语段进行词语匹配与位置标注,而后对语句情感进行量化处理,实现语句的情感量化,最终通过加权计算处理分析用户的阶段性情感倾向与情感倾向性的多极情感分析模块;通过分析网络学习用户的情感倾向性与用户行为将用户分为活跃的积极用户、活跃的消极用户、游览学习的用户和抽样学习的用户四类的用户分类模块;用于实时预测用户行为的用户行为实时预测模块;用于展示用户ID、课程信息、课程教师、实时毕业概率、用户类别、情感倾向性、课程完成情况、考试成绩和毕业情况的状态评估可视化模块;所述的数据采集及数据库管理模块与数据预处理模块信号连接,所述的数据预处理模块分别与数据采集及数据库管理模块、用户分类模块、多极情感分析模块信号连接,所述的用户分类模块分别与数据预处理模块、状态评估可视化模块、多极情感分析模块信号连接,所述的多极情感分析模块分别与数据预处理模块、用户分类模块、用户行为实时预测模块信号连接,所述的用户行为实时预测模块分别与多极情感分析模块、状态评估可视化模块信号连接。

2.根据权利要求1所述的基于多极情感分析的用户行为预测系统,其特征是,所述的数据采集及数据库管理模块所采集的数据包括:文本数据与学习行为数据,其中文本数据包括:用户评论文本、用户发起话题文本、用户提问文本、用户回复话题文本、用户回复提问文本、私信教师文本、私信其他用户文本和用户基本信息;学习行为数据包括:参与观看情况、参与评论情况、参与问答情况、私信教师情况、考试成绩、毕业情况、作业完成情况和私信其他用户情况。

3.根据权利要求1所述的基于多极情感分析的用户行为预测系统,其特征是,所述的数据预处理模块的功能是,分别对文本数据与用户行为数据进行预处理,其中,需要经过数据的预处理学习行为数据包括:参与观看情况、参与评论情况、参与问答情况、私信教师情况和私信其他用户情况五项学习行为数据;首先,将所述的五项学习行为数据处理成包括时间属性与参与度属性的二维时间序列;其次,将所述的五项学习行为数据二维时间序列进行合并运算,得到参与度时间序列,文本数据预处理的功能在于,基于分词词典以课时为时间节点,将每个时间节点的文本语段进行分词处理。

4.根据权利要求1所述的基于多极情感分析的用户行为预测系统,其特征是,所述的多极情感分析模块用于文本数据的情感量化处理,最终将文本数据表示为情感向量,首先,基于多种词性词典对分词处理后的语段进行词语匹配与位置标注;而后,对语句情感进行量化处理,实现语句的情感量化;最终,通过加权计算处理分析用户的阶段性情感倾向与情感倾向性,其中,用于词性分析的词典包括多极情感词典,程度副词词典,否定词词典,转折连词词典,情感标点符号和情感表情符号。

5.根据权利要求1所述的基于多极情感分析的用户行为预测系统,其特征是,所述的用户分类模块四种用户类型中,所述的活跃的积极用户为:课程学习参与度较高,而且情感倾向性表现为积极的用户;所述的活跃的消极用户为:课程学习参与度较高,而且情感倾向性表现为消极的用户;所述的游览学习的用户为:仅参与前期课程的学习,三节课时以后不再参与课程学习的用户;所述的抽样学习的用户为:不定时参与课程学习,旷课次数较多的用户。

6.根据权利要求1所述的基于多极情感分析的用户行为预测系统,其特征是,所述的用户行为预测模块的功能是实时预测用户的行为,主要通过分析用户的多极情感预测其毕业概率。

7.根据权利要求1所述的基于多极情感分析的用户行为预测系统,其特征是,所述的状态评估可视化模块的功能是,根据状态评估可视化处理,展示相应的用户行为,包括:实时毕业概率、用户类别、情感倾向性、课程完成情况、考试成绩和毕业情况。

8.一种基于多极情感分析的用户行为预测方法,其特征是,它包括以下步骤:步骤1:针对网络教学网站,进入数据采集及数据库管理模块,利用网络爬虫采集网络教学网站数据,依据字段属性与数据结构,将网页数据保存到数据库中;

步骤2:对所述网页数据进行数据预处理:(1)定义参与观看时间序列CVPTS,CVPTS是每个课时用户是否参与课程观看的时间序列,参与观看记为1,未参与观看记为0;

(2)定义参与评论时间序列CCPTS,CCPTS是每个课时用户是否参与课程评论的时间序列,参与评论记为1,未参与评论记为0;

(3)定义参与问答时间序列CQPTS,CQPTS是每个课时用户是否参与课程问答的时间序列,参与问答记为1,未参与问答记为0;

(4)定义私信教师时间序列CTPTS,CTPTS是每个课时用户是否私信教师的时间序列,私信记为1,未私信记为0;

(5)定义私信其他用户时间序列COPTS,COPTS是每个课时用户是否私信其他用户的时间序列,私信记为1,未私信记为0;

(6)定义参与度时间序列ACPTS,判断在每个课时,用户是否参与课程观看,参与评论,参与问答,私信教师,私信其他用户五项用户行为中的任何一项行为活动,参与记为1,未参与记为0;

(7)以课时为时间节点,合并每个时间节点的文本语段,文本语段包括:用户评论文本Comment,用户发起话题文本Topic‑Create,用户提问文本Question‑Create,用户回复话题文本Topic‑Reply,用户回复提问文本Question‑Reply,私信教师文本To‑Teacher,私信其他用户文本To‑Other;

(8)语段分词,利用分词词典对所述的各时间节点的合并文本语段,进行分词处理;

步骤3:情感表达规则建立:

(1)扩展现有多极情感词典:计算词语相似度Similarity,在同义词词典中选择每个情感词词意相似度最高的五个词语,并添加到现有情感词典中;

(2)定义多极情感词典影响强度w;

(3)定义程度副词影响强度ε;

(4)定义情感标点符号影响强度ω;

(5)定义情感表情符号影响强度δ;

(6)定义否定词影响强度μ;

(7)定义转折连词对前向与后向子句的影响强度σ;

步骤4:语句情感量化:

(1)定义语段s,并对语段s进行分句处理;

(2)定义语句si,si是语段s中的第i个语句;

(3)定义语句的多极情感量化值p(si),采用公式 得到*

语句的情感量化值,其中,n是语句si中情感词的总数,wj是语句si中第j个情感词的影响强度,m是修饰情感词wj的程度副词总数,εk是语句si中第k个程度副词的影响强度,ω是情感标点符号的影响强度,δ是情感表情符号的影响强度,μ是否定词的影响强度,σ是转折连词对前向与后向子句的影响强度;

步骤5:语段情感向量化:

(1)定义课时节点t;

(2)定义语段情感向量vt,采用公式 得到语段情感向量,其中,n是语段s中语句的总数;

步骤6:阶段性情感倾向分析:

(1)定义阶段性单极情感量化值pst,其中,t是课时节点;

(2)定义阶段性情感倾向max pst,采用统计分析法计算每一课时t的情感量化值最高的单极情感量化值,得到阶段性情感倾向max pst;

步骤7:情感倾向性分析:

(1)定义情感倾向性Et,采用公式 得到用户情感倾向性,其中,n’是课时的总数;

(2)定义积极情感倾向性,积极情感倾向性包含:快乐,惊讶,傲慢,爱慕;

(3)定义消极情感倾向性,消极情感倾向性包含:悲伤,愤怒,失望,傲慢,恐惧;

步骤8:用户分类:

(1)定义活跃的积极用户,判断参与度时间序列是否具有较高的完整度,并具有积极情感倾向性;

(2)定义活跃的消极用户,判断参与度时间序列是否具有较高的完整度,并具有消极情感倾向性;

(3)定义浏览学习的用户,通过公式iff and Pc(t)≠1 when t≥

3判断用户是否属于浏览学习的用户;

(4)定义抽样学习的用户,定义参与度时间序列ACPTS的旷课次数rv,通过公式iff rv≥3 and

判断用户是否属于抽样学习的用户;

步骤9:学习行为实时预测:

(1)实时统计用户每个课时的阶段性情感倾向max pst;

(2)实时计算每个课时的阶段性积极情感与消极情感比率r;

(3)将每位用户的阶段性积极情感与消极情感比率r及相应的毕业情况输入毕业概率

3 2

回归函数f(x)=p1×r+p2×r+p3×r+p4,其中,p1,p2,p3,p4是回归函数的回归系数,f(x)是预测的毕业概率;

(4)将未处理用户的阶段性积极情感与消极情感比率r输入毕业概率回归函数f(x)实时预测毕业概率;

步骤10:在状态评估可视化模块显示用户的行为与状态,包括:预测毕业概率,用户类别,情感倾向性,课程完成情况,考试成绩,毕业情况。