欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2023104430332
申请人: 齐鲁工业大学(山东省科学院)
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-02-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种社交媒体网络的威胁情报识别方法,其特征在于,包括:

对从社交媒体网络中采集的文本数据进行预处理,得到单词库;

将单词库中的单词转换为语义向量表示,将语义向量表示的单词作为节点,构建基于词语共现的图结构;

使用图神经网络从图结构中提取结构特征,使用序列化模型从语义向量表示中提取语义特征,并将结构特征和语义特征进行融合;

使用多层感知机对融合后的特征进行分类和识别,得到文本数据中的威胁情报;

所述基于词语共现的图结构的构建,以单词库中的每个单词作为节点,计算两个单词共同出现在同一上下文中的次数来构建两个单词之间的边,得到一张无向图,作为图结构;

在这个过程中,使用基于词语共现的方法,计算两个单词共同出现在同一上下文中的次数来构建边,共现次数越高,表示两个单词在语义上的关联程度越强,共现次数作为边的权重,具体为:上下文是指单词周围的词汇环境,通过设置固定或动态窗口来捕捉,在基于词语共现构建边时,使用动态窗口大小,而不是固定大小的窗口,动态窗口的大小根据单词在句子中的位置或与其他单词的距离进行调整;

所述图神经网络,基于注意力机制,根据节点之间的关系为相邻节点分配权重,并在聚合邻居节点信息时进行加权,关注与目标节点相关的邻居节点,提取更具代表性的结构特征,具体为:每对相邻节点引入一个可学习的注意力系数,描述一个节点在更新其嵌入时应该关注其邻居节点的程度;通过使用注意力系数,捕捉节点之间的相关性,并在聚合邻居节点信息时进行有针对性的加权。

2.如权利要求1所述的一种社交媒体网络的威胁情报识别方法,其特征在于,所述预处理,包括数据清洗和分词。

3.如权利要求1所述的一种社交媒体网络的威胁情报识别方法,其特征在于,所述将单词库中的单词转换为语义向量表示,是使用word2vec模型,进行向量转换,反映单词在语义上的相似性。

4.如权利要求1所述的一种社交媒体网络的威胁情报识别方法,其特征在于,所述图神经网络,进行信息传递并根据节点和边之间的关系,提取节点的结构特征。

5.如权利要求1所述的一种社交媒体网络的威胁情报识别方法,其特征在于,所述序列化模型,对单词的语义向量表示进行时间序列建模,捕捉文本数据中的时序信息,得到语义特征。

6.如权利要求1所述的一种社交媒体网络的威胁情报识别方法,其特征在于,所述将结构特征和语义特征进行融合,具体为:进行归一化处理进行加权,得到一个更高级别的特征表示;

将得到的特征表示,按照时间步连接起来,形成一个二维的时间‑特征矩阵。

7.一种社交媒体网络的威胁情报识别系统,其特征在于,包括预处理模块、图构建模块、特征提取模块和威胁识别模块:所述预处理模块,被配置为:对从社交媒体网络中采集的文本数据进行预处理,得到单词库;

所述图构建模块,被配置为:将单词库中的单词转换为语义向量表示,将语义向量表示的单词作为节点,构建基于词语共现的图结构;

所述特征提取模块,被配置为:使用图神经网络和序列化模型提取结构特征和语义特征,并将结构特征和语义特征进行融合;

所述威胁识别模块,被配置为:使用多层感知机对融合后的特征进行分类和识别,得到文本数据中的威胁情报;

所述基于词语共现的图结构的构建,以单词库中的每个单词作为节点,计算两个单词共同出现在同一上下文中的次数来构建两个单词之间的边,得到一张无向图,作为图结构;

在这个过程中,使用基于词语共现的方法,计算两个单词共同出现在同一上下文中的次数来构建边,共现次数越高,表示两个单词在语义上的关联程度越强,共现次数作为边的权重,具体为:上下文是指单词周围的词汇环境,通过设置固定或动态窗口来捕捉,在基于词语共现构建边时,使用动态窗口大小,而不是固定大小的窗口,动态窗口的大小根据单词在句子中的位置或与其他单词的距离进行调整;

所述图神经网络,基于注意力机制,根据节点之间的关系为相邻节点分配权重,并在聚合邻居节点信息时进行加权,关注与目标节点相关的邻居节点,提取更具代表性的结构特征,具体为:每对相邻节点引入一个可学习的注意力系数,描述一个节点在更新其嵌入时应该关注其邻居节点的程度;通过使用注意力系数,捕捉节点之间的相关性,并在聚合邻居节点信息时进行有针对性的加权。

8.一种电子设备,其特征是,包括:

存储器,用于非暂时性存储计算机可读指令;以及

处理器,用于运行所述计算机可读指令,

其中,所述计算机可读指令被所述处理器运行时,执行上述权利要求1‑6任一项所述的方法。

9.一种存储介质,其特征是,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行权利要求1‑6任一项所述方法的指令。