欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020107863731
申请人: 哈尔滨商业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于复制神经网络的离群事件检测与识别方法,其特征在于包括以下步骤:步骤一:获取待处理中文文本序列数据;

步骤二:对待处理中文文本序列数据进行时间序列分析;

步骤三:对时间序列分析后的中文文本序列数据进行浅层语义分析;

步骤四:对浅层语义分析后的中文文本序列数据,利用基于深度学习策略进行事件触发词的识别与抽取;

步骤五:对事件触发词识别与抽取后的中文文本序列数据进行候选事件识别;

步骤六:将候选事件识别后的中文文本序列数据作为输入,利用训练好的复制神经网络进行离群事件的检测与识别;

所述复制神经网络的训练过程为:

A将待处理中文文本序列数据作为数据集合,把数据集合的每一列都进行归一化处理;

B选择70%的数据作为训练集合,30%的数据作为验证集合;

C随机生成一个三层的神经网络结构,权重随机生成,范围在[0,1]内,输入层的数据和输出层的数据保持一致,并且神经网络中间层的节点个数是输入层的一半;

D使用BP算法训练模型,当训练集合的误差降低,并且验证集合的误差增加时,则停止训练,同时返回具有最小验证集合误差的神经网络,将该神经网络作为训练好的神经网络。

2.根据权利要求1所述的基于复制神经网络的离群事件检测与识别方法,其特征在于在所述复制神经网络的训练过程中,使用BP算法训练模型,并在误差的目标函数中增加连接权与阈值的平方和,用于描述网络复杂度。

3.根据权利要求1所述的基于复制神经网络的离群事件检测与识别方法,其特征在于在所述步骤二之前执行如下步骤:首先对待处理中文文本序列进行时间序列的归一化处理,然后采用参考时间动态选择机制对时间表达式进行规范化,并采用关键词机制,将面向句子的时间识别转化为面向篇章的主题事件片段的时间识别。

4.根据权利要求3所述的基于复制神经网络的离群事件检测与识别方法,其特征在于所述主题事件片段的时间识别的具体步骤为:识别事件的时间,进而将面向句子或短语的时间识别转化为面向篇章的时间识别,从而识别主题事件片段的时间。

5.根据权利要求4所述的基于复制神经网络的离群事件检测与识别方法,其特征在于所述时间表达式包括明确的时间表达式和隐式时间表达式。

6.根据权利要求5所述的基于复制神经网络的离群事件检测与识别方法,其特征在于所述隐式时间表达式通过上下文和先验知识确定。

7.根据权利要求1所述的基于复制神经网络的离群事件检测与识别方法,其特征在于所述步骤三中浅层语义分析的具体步骤为:基于统计机器学习方法,以句法成分为标注单位,首先采用分词、词性标记、命名实体识别、浅层句法分析过程对输入文本进行预处理,得到完整句法分析树;其次通过剪枝技术过滤掉句法分析树中不是语义角色的句法成分结点;再次采用典型的二元分类方法,逐个判断候选句法成分是否为目标谓词的语义角色;然后采用分类技术对语义角色进行分类;

最后对上述机器学习方法获得的结果进行修正。

8.根据权利要求1所述的基于复制神经网络的离群事件检测与识别方法,其特征在于所述步骤四中事件触发词的识别的具体步骤为:首先使用Bi-LSTM模型对每个词及其前面信息和后面信息的语义进行编码,同时,结合CNN模型共同组成一个向量表示;

所述Bi-LSTM模型由前向LSTM神经网络和反向LSTM神经网络组成,前向LSTM神经网络用于对当前词之前的上下文建模,反向LSTM神经网络用于对当前词之后的上下文进行建模,前向LSTM神经网络的输入是当前词以及当前词前面的上下文信息,反向LSTM神经网络的输入是当前词以及当前词后面的上下文信息,从前向后运行前向LSTM神经网络,从后向前运行反向LSTM神经网络,然后,将前向LSTM神经网络的输出和反向LSTM神经网络的输出进行结合,作为Bi-LSTM模型的输出,即该当前词作为事件触发词的候选;

所述CNN模型具有不同宽度的多个卷积过程filter,将卷积过程filter的输出发送到Max-Pooling层,得到一个具有固定长度的输出向量,之后,用softmax方法对输出向量进行处理,识别候选触发词,最后,将每个候选触发词分类为一种事件类型,触发词和待识别的事件类型相对应。

9.根据权利要求1所述的基于复制神经网络的离群事件检测与识别方法,其特征在于所述步骤五中候选事件识别包括:特征轨迹、事件片段的相似性、发展趋势和预测过程四个步骤;

所述特征轨迹中,特征即表示该事件的触发词,特征Wi在某一时刻t对事件的影响,即特征能量fit,特征能量fit用于分析该事件的所有特征的变化情况;

所述事件片段的相似性表示具有相同时间窗口的事件片段的差异程度,事件片段et由时间窗口中的特征fit表示,即[f1t,f2t,...,fnt],事件片段的相似度即为特征向量之间的相似度;

所述发展趋势表示用某个主题片段中的所有特征能量表示某个事件片段发生的强度和进展,主题事件片段的能量pow(et)由该时间窗口中包含的所有特征能量表示,事件的变化趋势即事件片段的能量变化趋势;

所述预测过程表示基于时序对整个事件中的事件进行模拟和预测,用某些时间间隔内的信息来预测下一时间间隔内某个元事件或事件发生的情况。