1.一种基于图注意力自动编码器的车辆重叠群组检测方法,其特征在于,包括以下步骤:步骤1、将网络拓扑结构和节点属性信息输入图注意力自动编码器的编码器部分,通过自动编码器结构,不仅学习到车辆节点的潜在表示,还通过重构损失来优化模型,使其捕捉其中的关键结构特征;
步骤2、编码器的图注意力机制对输入的网络拓扑结构和节点属性信息进行编码,经过注意力机制的处理后,表示为多个不同的隐层嵌入表示,这些不同的嵌入捕捉了节点之间的复杂关系和属性差异,再通过一个激活函数进行非线性变换,生成新的节点嵌入表示;
步骤3、解码器将新的节点嵌入表示与原始的嵌入表示进行组合,通过解码过程还原网络拓扑结构和节点属性信息,并与原始的拓扑结构和属性信息进行对比,评估重构的质量;
步骤4、通过模块度优化增强模块的优化约束,进一步调整节点嵌入,确保社群结构的合理性,使用M/M/1排队模型,并设定qij≥0和约束条件来进行优化,最终输出一个模块度优化增强损失LM,衡量社群检测的合理性;
步骤5、使用先验信息进行半监督聚类,根据图重建损失LR,模块度优化增强损失LM,半监督聚类损失LS进行优化,得到基于节点的嵌入表示生成社群检测结果。
2.根据权利要求1所述的基于图注意力自动编码器的车辆重叠群组检测方法,其特征在于,所述步骤2的具体步骤如下:步骤2.1、在多头注意力机制中,引入了l个独立的注意力头,每个头都有其自己的线性变换矩阵W(l),用于将原始节点特征hi转换为新特征空间,这个变换是对每个节点特征向量单独进行的,公式如下:其中是节点i在第l个头中的新特征表示;
步骤2.2、对每个节点vi和vj计算一个注意力打分,表示节点vj对节点vi的重要性,这个打分基于线性变换后的特征表示和进行计算,公式为:其中a(l)是第l个头的注意力权重向量,长度为2F',用于将拼接后的向量映射到一个标量,而||就表示拼接操作,其中F'是每个头的新特征空间维度,LeakyReLU是激活函数;
步骤2.3、使用softmax函数对所有邻居节点的原始注意力分数进行归一化,从而得到最终的注意力系数这个过程确保了所有邻居节点的注意力系数之和为1:步骤2.4、对于每个注意力头l,用注意力系数对邻居节点特征进行加权求和,得到每个头l的特征输出步骤2.5、对所有头的输出特征进行平均,得到最终的节点表示:
3.根据权利要求1所述的基于图注意力自动编码器的车辆重叠群组检测方法,其特征在于,所述步骤3包括以下骤:步骤3.1、通过节点的潜在表示Z重构邻接矩阵A,其中A是预测的邻接矩阵,在使用多头注意力机制时,潜在表示zi是从多个注意力头的输出特征聚合而来,对多个头的输出特征求平均,每个节点的潜在表示为:步骤3.2、节点的潜在表示zi仍然是F'维向量,解码器的公式保持不变,计算公式如下:其中是解码器预测的节点i和节点j之间的边的存在性,zi和zj分别是节点i和j的潜在表示,σ是激活函数,通常选择Sigmoid函数:步骤3.3、解码器的最终结果作为重建的节点属性值,重建节点属性值的损失函数定义为式(9);
其中Xi是第i个节点的原始二值属性,是模型预测的第i个节点属性为1的概率,这个损失函数是对每个节点的二值属性重建进行二元交叉熵计算,通过最小化损失来优化模型对节点属性的重建效果;
步骤3.4、邻接矩阵预测的损失函数定义为式(10):
其中Aij表示原始邻接矩阵中的元素,节点i和节点j之间是否存在边,如果Aij=1,表示节点i和节点j之间有边;如果Aij=0,表示没有边,是模型预测的邻接矩阵中的元素,表示模型预测节点i和节点j之间有边的概率;
步骤3.5、最终的重建损失函数由拓扑结构和节点属性的重建损失相结合形成;
LR=αLattr+βLtop (11);其中α和β是超参数,用于平衡节点属性重建损失和邻接矩阵预测损失的影响。
4.根据权利要求1所述的基于图注意力自动编码器的车辆重叠群组检测方法,其特征在于,所述步骤4包括以下步骤:步骤4.1、将编码器输出的最终的节点表示矩阵H通过模块度优化增强模块进一步细化,而模块度是指示网络社群结构强度的指标,定义为:其中di和dj是节点i和节点j的度数,Hi和Hj表示节点i和j的属性向量,表示节点i和j的属性相似度;
步骤4.2、在模块度最大化模块中增加一个马尔可夫排队系统变成模块度优化增强模块,在马尔可夫排队系统中,节点之间的状态转换用状态转移矩阵P来表示,定义增强后的模块度优化目标为:其中Pij表示节点i转移到节点j的概率,AijPij表示不仅考虑节点之间是否有直接的边,还考虑节点之间动态交互的强度;
步骤4.3、为了优化这个增强的模块度,定义相应的损失函数为:
LM=-QM (14)。
5.根据权利要求1所述的基于图注意力自动编码器的车辆重叠群组检测方法,其特征在于,所述步骤5包括以下步骤:步骤5.1、通过半监督聚类模块结合已知的节点标签信息Y,最终得到社群检测的结果,通过半监督的策略,保持已知标签的一致性,并同时挖掘未标记节点的潜在社群归属,使得整个社群划分更加合理,因此,使用的交叉熵损失作为半监督损失LS:其中是已标记数据的集合,Yij表示已标记节点i是否属于节点j的真实标签;
步骤5.2、为了获得更准确的社群成员表示矩阵H,将图注意力自动编码器、模块度优化增强和半监督聚类模块整合为一个整体,得到更准确的社群检测结果,最终目标函数如式(16)中定义,L=LR+γLS-λLM (16);
其中γ和λ是代表不同损失权重的超参数,用于调整相应模块的贡献,LR、LM和LS分别表示图注意力自动编码器、模块度优化增强和自训练聚类模块的损失;
步骤5.3、根据最终的损失函数L来训练模型,得到最终的社群检测结果。