1.一种基于图神经网络的恶意软件快速检测方法,其特征在于,该方法包括:构建恶意软件检测模型;获取待检测软件的应用数据,将待检测软件的应用数据输入到恶意软件检测模型中,得到检测结果;
采用恶意软件检测模型对待检测软件的应用数据进行处理的过程包括:S1、采用不同的元路径和元图对输入的待检测软件的应用程序数据进行特征提取,根据提取的特征构建异质图网络;
S2、采用HG2vec算法对异质图网络中的软件实体节点的高阶领居节点进行消息聚合,得到待检测软件节点的高阶增强嵌入表示;
S3、采用自注意力机制对经过不同元结构的高阶增强嵌入表示进行语义融合,得到融合后节点的最终嵌入向量表示;
S4、采用Sim2vec算法对待测软件节点的最终嵌入向量表示进行分类检测,得到待测软件的检测结果。
2.根据权利要求1所述的一种基于图神经网络的恶意软件快速检测方法,其特征在于,采用不同的元路径和元图对输入的待检测应用数据进行特征提取的过程包括:S11、获取待检测软件的数据信息,该数据信息包括代码文件、配置文件以及签名信息;
提取数据信息中的五类实体作为软件的关键特征,五类实体包括API、权限、组件、签名以及服务;
S12、根据待检测软件的五类实体构建不同的元结构,获取各个元结构的邻接矩阵,对各个邻接矩阵进行点乘,得到异质图网络。
3.根据权利要求1所述的一种基于图神经网络的恶意软件快速检测方法,其特征在于,采用HG2vec算法对异质图网络中的软件实体节点的高阶领居节点进行消息聚合的过程包括:S21、采用单层神经网络构成的映射函数将不同元路径中高阶领居节点的隐藏信息投影到语义空间中,并采用聚合函数将所有投影到语义空间中的邻居信息进行聚合,得到节点嵌入;
S22、采用GAT方法计算节点嵌入中各个节点之间的权重,并对计算出的权重进行Lipschitz归一化处理,得到权重系数;
S23、根据权重系数和节点嵌入对各个节点嵌入中的相邻节点进行聚合,得到聚合后的节点级语义特征;
S24:采用堆叠节点聚合方法对节点进行高阶属性增强,得到基于单个元结构的节点高阶嵌入表示。
4.根据权利要求3所述的一种基于图神经网络的恶意软件快速检测方法,其特征在于,得到节点嵌入的公式为:Φ
Z =gΦ(fΦ(X))
Φ Φ
fΦ(X)=σ(X·W +b )
Φ
其中,Z 表示语义特定的节点嵌入,gΦ表示聚合函数,fΦ表示映射函数,X表示初始特征Φ Φ矩阵,σ表示激活函数,W 表示元路径Φ的权重矩阵,b 表示元路径Φ的偏差向量。
5.根据权利要求3所述的一种基于图神经网络的恶意软件快速检测方法,其特征在于,采用堆叠节点聚合方法对节点进行高阶属性增强的过程包括:S241、将目标类型节点的初始特征矩阵输入到HG2vec框架中,对其一阶领居节点进行增强表示,并将增强节点嵌入表示作为输出;
S242、将第二个节点注意力层NAL的输出当作下一个NAL的输入,由此堆叠N层后获取单个节点的高阶领居节点的增强嵌入表示。
6.根据权利要求3所述的一种基于图神经网络的恶意软件快速检测方法,其特征在于,权重系数的表达式为:其中, 表示第i个节点与第j个节点之间的重要性,σ表示激活函数, 表示元路径Φ的节点级注意向量,h′i表示i节点的投影特征,||表示连接操作,h′j表示j节点的投影特征,表示节点i的基于元结构的邻居。
7.根据权利要求1所述的一种基于图神经网络的恶意软件快速检测方法,其特征在于,采用自注意力机制对经过不同元结构的高阶特征进行融合的过程包括:S31、获取每个元结构的学习权重,并构建为权重矩阵;
S32、根据自注意力机制通过权重矩阵计算每个元结构的重要性;
S33、根据计算后的每个元结构的重要性权重对不同元结构的高阶特征进行融合,得到融合后的节点嵌入向量表示。
8.根据权利要求7所述的一种基于图神经网络的恶意软件快速检测方法,其特征在于,元路径的重要性公式为:T
其中,V表示所有的特定语义节点,q 表示语义层面的注意力向量,tanh表示激活函数,W是权重矩阵, 表示节点的高阶增强表示向量,b是偏差向量。
9.根据权利要求1所述的一种基于高阶图神经网络的恶意软件检测方法,其特征在于,采用Sim2vec算法对未知的节点进行快速分类检测的过程包括:S41、将待检测软件节点的关系矩阵与已知软件节点的关系矩阵连接,得到待测软件节点到已知软件节点的新路径,根据新路径构建一个具有新的邻接关系的增量邻接矩阵;
S42、计算未知节点和现有的已知节点的元结构相似度,提取前N个最相似的已知节点嵌入表示;
S43、根据相似度的权重将对应已知节点进行聚合,得到单节点的节点级别嵌入表示;
S44、根据已有模型的元结构权重对前N个单节点的节点级别嵌入表示进行语义融合,得到未知软件的节点嵌入表示,未知软件的节点嵌入表示为分类结果。