欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2021102550519
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2024-02-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种恶意软件的传播预测方法,其特征在于,所述方法包括:获取数据库中用户节点及其交互数据,所述用户节点为恶意软件传播网络中的所有用户节点,所述实时数据包括用户节点信息、用户节点行为特征以及用户节点传播内容;

根据所获取的用户节点交互数据提取出用户节点的传播属性;所述用户节点的传播属性包括用户节点活跃度以及恶意软件感染强度;

采用Doc2vec算法从所述用户节点传播内容组成的段落中学习出用户节点的行为特征向量;

采用基于张量分解的向量化算法Tensor2vec从所述恶意软件传播网络中学习出用户节点网络结构特征向量;

将所述用户节点行为特征向量以及所述用户节点网络结构特征向量输入到图卷积神经网络中,对恶意软件进行传播预测,并预测出恶意软件是否传播给用户节点以及所述恶意软件的传播趋势。

2.根据权利要求1所述的一种恶意软件的传播预测方法,其特征在于,所述获取数据库中用户节点及其交互数据后包括对用户节点实时数据进行数据清洗,将非结构化的实时数据转换为结构化数据。

3.根据权利要求1所述的一种恶意软件的传播预测方法,其特征在于,所述用户节点活跃度表示为:

AV(ui)=log2(N[twitter(ui)]+N[comment(ui)])+N[retweet(ui)]其中,AV(ui)表示用户节点ui的活跃度;N[twitter(ui)]表示用户节点ui在时间段t内主动传播信息的数量,N[comment(ui)]表示用户节点ui在时间段t内评论的信息数量,N[retweet(ui)]表示用户节点ui在时间段t内转发信息的数量;

所述恶意软件感染强度表示为:

其中,Inf(mi)表示恶意软件mi的感染强度;AV(uj)表示在时段t内,已感染该恶意软件的用户节点uj的活跃度,Backup(uj)表示用户节点uj的潜在用户节点。

4.根据权利要求1所述的一种恶意软件的传播预测方法,其特征在于,所述采用Doc2vec算法从所述用户节点传播内容组成的段落中学习出用户节点的行为特征向量包括提取一段时间内用户节点传播内容组成段落,采用jieba中文分词方式对所述段落进行分词处理,并保留所述用户节点传播内容中的名词和动词,并去除无用词,得到用户节点行为的候选关键词;采用TF‑IDF算法计算词频时区分活跃用户节点与普通用户节点的系数;基于所述系数,从所述候选关键词中选择出用户节点行为数据中的关键词,并得到表示用户u

节点行为的关键词序列;采用Doc2vec算法输出用户节点行为的特征向量T=N×F ,其中,Nu

为恶意软件传播网络中的用户节点数,F为用户节点行为特征的表示向量。

5.根据权利要求1所述的一种恶意软件的传播预测方法,其特征在于,所述采用基于张量分解的向量化算法Tensor2vec从所述恶意软件传播网络中学习出用户节点网络结构特征向量包括构建出所述恶意软件传播网络中已感染恶意软件的用户节点、未感染恶意软件的用户节点以及用户节点交互强度的三元组之间三维张量;通过Turcker分解的方式进行张量分解,采用不同的模态对各个维度的矩阵展开,并对组成张量的所有阶按交错次序进行采样;利用奇异值分解的方式获取各个模态展开后的近似矩阵,从而获取近似张量;根据所述近似张量提取出用户节点之间的隐含关联度,按照所述关联度的大小决定网络结构中用户节点的动态游走方式;按照对应的游走方式进行采样得到每个用户节点产生的序列,将这些用户节点产生的序列导入skip‑gram模型中得到每个用户节点的嵌入向量,在满足损失函数的条件下,输出用户节点的网络结构特征向量。

6.根据权利要求5所述的一种恶意软件的传播预测方法,其特征在于,所述根据所述近似张量提取出用户节点之间的隐含关联度,表示为HR(vi,vj)=Ai,j;其中,HR(vi,vj)表示为用户节点vi和用户节点vj的隐含关联度;Ai,j表示近似张量χ中A矩阵对应的第i行第j列的元素值。

7.根据权利要求5所述的一种恶意软件的传播预测方法,其特征在于,所述按照所述关联度的大小决定网络结构中用户节点的动态游走方式包括当前用户节点vi访问下一个用户节点vj的条件表示为HR(vi,vj)=max(HR(vi,vj),0≤j≤n);HR(vi,vj)表示为用户节点vi和用户节点vj的隐含关联度;n表示恶意软件传播网络中的用户节点数。

8.根据权利要求5所述的一种恶意软件的传播预测方法,其特征在于,所述损失函数表示为:

其中,Nt(v)表示通过张量分解方法采样出的用户节点v的关联用户节点集合,F(v)是将用户节点v映射的嵌入向量, Pr(ni|F(v))表示在用户节点v映射的嵌入向量F(v)下通过张量分解方法采样出的用户节点ni的概率。

9.根据权利要求5所述的一种恶意软件的传播预测方法,其特征在于,所述图卷积神经网络对恶意软件进行传播预测的概率表示为:t+1

其中,P 表示t+1时刻传播某类恶意软件的用户节点的概率;

表示用户节点间的邻接矩阵所对应的归一化对称矩阵;

表示矩阵 的对角矩阵; 表示表示用户节点间的邻接矩阵所对应的增广矩阵;Adj表示用户节点间的邻接矩阵;I表示单位矩阵;ReLU(x)

0 1

=max(0,x),W为图卷积神经网络中第零层的权重矩阵;W为图卷积神经网络中第一层的权重矩阵。