欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 202510215540X
申请人: 四川轻化工大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-12-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种BERT-MO-CNN-BILSTM的中文评论情感分析方法,其特征在于,包括以下步骤:步骤一:获取中文评论文本及情感分类,对中文评论文本进行预处理,包括文本清洗、去除停用词和分词;

步骤二:通过ChineseBERT将预处理后的文本转化为词嵌入矩阵,并将情感分类转化为独热编码;

步骤三:设置矿山开采优化算法所需参数;

步骤四:确定多尺度卷积串联双向长短时记忆神经网络的网络结构,通过矿山开采优化算法的6个阶段,优化多尺度卷积串联双向长短时记忆神经网络的超参数;

所述矿山开采优化算法包括6个阶段:

(1)矿井初始化阶段,在求解域内随机生成K个矿井,每个矿井有一个开采中心,矿井开采中心位置的初始值Ki表达式为:Ki=lb+(ub-lb)×rand(0,1)

其中,Ki代表第i个矿井开采中心的位置,i=1,2,…,K,lb为搜索域在每个维度的下限,ub为搜索域在每个维度的上限,Ki,lb,ub都是N维向量,其中N代表求解问题维度,rand(0,1)代表0~1之间的随机数组成的N维向量;

(2)选取优质矿井阶段,计算K个矿井开采中心的适应度值,选取开采中心适应度值最优的E个矿井作为优质矿井:E=round(K×Kp)

其中,E为优质矿井的数量;Kp为优质矿井比例;round()函数代表对括号内的数值四舍五入取整数;

(3)采矿阶段,对于E个优质矿井,在每个矿井开采中心周围的开采中心搜索范围因子Tp内随机生成不同数量的采矿点,搜索范围range随迭代次数的增大而减小:range=Tp×(ub-lb)×(1-t/T)

其中,t为当前迭代的次数,T为最大迭代次数;

采矿点的数量与优质矿井开采中心的适应度值排名和迭代次数有关,每个优质矿井开采中心周围生成的采矿点的数量表示为:Sa=round(Ma×(E-a+1)×(1-t/T)

其中,Sa为第a个优质矿井周围生成的采矿点的数量,a为优质矿井的适应度值的排名,适应度值越低排名越高,a=1,2,…,E,Ma为开采点基数;

则生成的每个采矿点的位置为:

Kaj=KAa+range×(2×rand(0,1)-1)其中,Kaj代表第a个优质矿井开采中心周边生成的第j个采矿点的位置,j=1,2,…,Sa,KAa为第a个优质矿井开采中心的位置,Kaj和KAa均是N维向量;

(4)开采群评比阶段,首先,对于E个优质矿井,将该优质矿井开采中心与该优质矿井生成的开采点组成开采群,对于非优质矿井,则开采群由该矿井开采中心自身组成;

其次,计算各开采群中每个采矿点的适应度值,并结合各开采群开采中心的适应度值,得到每个开采群的平均适应度值FTi和平均位置KSi,即:其中,F()是适应度函数;

将平均适应度值FTi最优的开采群定义为最优开采群,将平均适应度值FTi最差和次差的开采群定义为最差开采群和次差开采群;

再次,通过适应度值对比,得到所有开采中心及采矿点中的最优适应度值FKDmin及对应位置、最差适应度值FKDmax,最优开采群中的最优位置及次优位置、最差开采群的平均适应度值FTmax、每个开采群中的最优适应度值(FKTmin)i及其所在的位置;

(5)探矿阶段,开采中心按照以下步骤进行探矿:

将每个矿井的开采中心位置Ki,更改为该开采中心所在的开采群中最优适应度值(FKTmin)i所在的位置;

对于最优开采群,以及全局最优适应度值FKDmin所在开采群,不再进行探矿,即其开采中心位置不变;

对于非最优开采群,且非全局最优适应度值FKDmin所在开采群,按概率选取某一优质矿井开采中心为目标,自该开采群的开采中心向该优质矿井开采中心方向进行探矿,而某一个优质矿井被选择概率与其开采中心的适应度值有关,概率表达为:其中R(a)代表第a个优质矿井被选择的概率,(FKTmin)a代表第a个优质矿井开采群的最优适应度值,采矿中心移动距离Di与适应度值和迭代次数有关,设第i个采矿中心选取了第a个优质矿井,则Di表示为:Di=Dt×(ub-lb)×Fia×Tia×(Ka-Ki)其中,Dt为最大移动步长比,Fia为适应度值影响项,Tia为迭代次数影响项,分别为:Fia=((FKTmin)i-(FKTmin)a)/(FKDmax-FKDmin)Tia=1-e(-rand(0,1)×t/T)

则该开采中心位置在下一次迭代的初始位置会更新为:

Kit+1=Kit+Dit

其中上标代表迭代次数;

(6)人力资源调配阶段,对于最差开采群和次差开采群,会对开采人员进行调配,其中,对于最差开采群,将其开采中心调配到最优开采群中的次优位置;对于次差开采群,删除原开采中心,并在求解域内随机生成一个点作为新开采中心,随机生成的方法与矿井初始化的方法一致;

删除所有采矿点,判断迭代是否结束,若迭代结束,输出最优参数,若迭代未结束,则返回阶段(2),并重复计算阶段(2)~阶段(6);

步骤五:将词嵌入矩阵输入优化超参数后的神经网络模型中,训练得到基于BERT-MO-CNN-BILSTM的中文评论文本情感分析模型;

步骤六:将待情感分类的文本数据进行预处理,并通过ChineseBERT生成词嵌入矩阵后,输入到训练好的中文评论文本情感分析模型中,得到情感分类。

2.如权利要求1所述的一种BERT-MO-CNN-BILSTM的中文评论情感分析方法,其特征在于,步骤三中,所述矿山开采优化算法所需参数,包括矿井个数K、优质矿井比例Kp,0

3.如权利要求1所述的一种BERT-MO-CNN-BILSTM的中文评论情感分析方法,其特征在于,步骤四中,所述多尺度卷积串联双向长短时记忆神经网络,包括输入层、多尺度卷积层和池化层、合并层、BILSTM层、全连接层和输出层;其中,多尺度卷积层和池化层要对不同尺寸的卷积核分别进行卷积和池化操作后进行合并,并将合并结果输入BILSTM层。

4.如权利要求1所述的一种BERT-MO-CNN-BILSTM的中文评论情感分析方法,其特征在于,步骤四中,所述超参数包括卷积层中的滤波器数量、多尺度的卷积核大小、BILSTM中隐藏单元数量、轮次大小和训练批次大小。