1.一种跨社交网络用户对齐方法,其特征在于,具体包括以下步骤:
S1:从两个社交网络中获取用户节点,将两个社交网络中已经确定为同一用户的用户节点称为anchor节点,还未确定的用户节点称为非anchor节点;
S2:将anchor节点初始化为特异性的标签,将非anchor节点初始化为0标签;
S3:给每个非anchor节点分配一个元组,所述元组包括节点自身的标签和一个标签列表;
S4:每个非anchor节点开始聚合邻居节点的标签,当聚合到0标签,则忽略,当聚合到特异性标签,则添加到非anchor节点的元组的标签列表中,聚合完成后节点的元组形成一个聚合向量;
S5:根据聚合向量计算非anchor节点的标签相似度,选取相似度高的标签作为非anchor节点的标签信息;
S6:重复S4‑S5直到非anchor节点的元组中不再有新的标签产生;
S7:将两个不同的社交网络合并,不再有新的标签产生的非anchor节点进行向量的表示学习,并更新向量表示;
S8:根据更新后的向量表示计算非anchor节点的相似度,将相似度最高的两个非anchor节点对齐。
2.根据权利要求1所述的一种跨社交网络用户对齐方法,其特征在于,在每一轮非anchor节点聚合到邻居节点的标签后,得到邻居节点之间的好友关系或相同关注关系的标签信息,成为新的邻居节点,所述邻居节点表示节点之间有好友关系或相同关注关系的节点。
3.根据权利要求1所述的一种跨社交网络用户对齐方法,其特征在于,根据聚合向量计算非anchor节点的标签相似度,其计算方式包括:sim
其中,WL 表示跨网络非anchor节点的标签相似度; 表示源网络的聚合标签表示向量; 表示目标网络的聚合标签表示向量;T表示向量的转置操作;||·||2表示正则化操作。
4.根据权利要求1所述的一种跨社交网络用户对齐方法,其特征在于,向量的表示学习具体包括:给每一个用户节点随机初始化为一个向量,通过损失函数使向量按照减小损失的方向优化,进行向量更新。
5.根据权利要求4所述的一种跨社交网络用户对齐方法,其特征在于,所述损失函数表达式为:其中, 表示源网络中的第i个节点和目标网络中的第j个节点的损失函数;
与 分别表示源网络的i节点和目标网络的j节点的向量表示,Lij表示i节点与j节点在聚合过程中是否拥有相同的映射标签, 表示源网络的i节点和目标网络的j节点的向量表示的余弦相似度函数;label()表示获取节点当前标签的函数。
6.根据权利要求1所述的一种跨社交网络用户对齐方法,其特征在于,利用损失函数拉近具有相同标签信息的非anchor节点的向量表示,其表达式包括:其中, 表示源网络中的第i个节点和目标网络中的第j个节点的上下文损失函数; 表示源网络与目标网络合并后的社交网络中第i个节点的表示向量; 表示源网络与目标网络合并后的社交网络中第j个节点的表示向量; 表示合并后的网络中第j个邻居节点的输入节点的表示向量;v″i代表第i个邻居节点的输出节点的表示向量;Cij代表j节点是否为i节点的邻居节点, 1代表是,0代表否;
context(i)为i节点的邻居节点的集合;T为向量的转置操作;logσ()表示基于sigmoid函数的激活函数。
7.根据权利要求1所述的一种跨社交网络用户对齐方法,其特征在于,根据更新后的的向量表示计算非anchor节点的相似度,包括:其中,rel(i,j)表示源网络中的第i个节点和目标网络中的第j个节点的节点相似度;
为源网络的第i个节点向量表示的第p维度的值; 为目标网络的第j个节点的向量表示的第p维度的值;d为向量的维度。