1.一种社交网络中基于相似社团的好友推荐方法,其特征在于,获取数据源信息模块获取包括标签在内的用户信息、用户朋友关系的社交信息;社团发现模块寻找社交网络中的社交社团;社团间相似度计算模块计算社团间结构相似度和属性相似度,并根据公式:Simi,j=α·ti,j+(1-α)·fi,j线性组合结构相似度和属性相似度得到社团间相似度Simi,j,其中,ti,j表示社团i与社团j的结构相似度,fi,j表示属性相似度,α为调节参数,取0到1之间的任意值,根据相似度排序生成Top-N相似社团集;社团用户角色发现模块利用用户节点在社团中的拓扑结构将用户分类,定义节点在网络中的角色;生成好友推荐集模块为目标社团的各类用户提供Top-N相似社团中相对应的同类或多类的好友推荐集,所述计算社团间结构相似度具体为:根据社团相邻边占两个社团所有边的比值获得社团间结构相似度,所述计算社团间属性相似度具体为:利用社团中用户的标签将社团属性划分为不同类型,并将社团属于各类型的概率表示为特征向量,社团划分类型集合定义为C={C1,C2,C3...,Cn},n为社团类型个数,社团中所有用户的标签构成社团标签集,如社团i有m个属性,形成属性向量为 分类器根据公式:对社团每一个类型Ck的社团属性进行分类,其中,θ∈{0,1},k∈{1,2...,n},i∈{1,2...,m};将社团属于不同类型的概率用特征向量fi来表现,即fi=(i1,i2...,in),其中ik=p(Ck=1|Xi)表示社团i属于类型Ck的概率;根据公式计算社团i与目标社团j特征向量的余弦相似度,得到各社团与目标社团的属性相似度;社团用户角色发现具体为:拥有相似结构的用户节点占据网络中的相同角色,通过分析用户节点在自身社团中以及其它社团中的角色地位来定义节点在网络中的角色;寻找社交网络中的社交社团具体包括:将每个用户初始化为一个独立社团,依次合并存在朋友关系的社团对,根据公式: 计算合并后的模块度增量值,直到模块度值最大化,寻找到社交社团,其中,A为邻接矩阵, 当
节点i与节点j在同一个社团时,δ(σi,σj)=1否则为0,ki为节点i的度,m为网络的总边数。
2.根据权利要求1所述的方法,其特征在于,计算社团间结构相似度具体包括:根据公式 计算社团i与社团j的结构相似度ti,j,其中,ei,j表示社团i中节点vi与社团j中的节点vj构成的边,ei表示社团i中的边,ej表示社团j中的边。
3.根据权利要求1所述的方法,其特征在于,拥有相似结构的节点占据网络中的相同角色,采用基于社团结构的二维网页排名度量方法,内排名InnerRank度量节点和与该节点在同一社团中与其它节点连接的紧密性,外排名OutterRank度量其它社团中连向节点的边分布的数量,根据内排名、外排名两个影响力的度量维度,将网络的节点划分成三种角色:核心点、重要点以及普通点。
4.根据权利要求3所述的方法,其特征在于,二维网页排名度量方法具体包括:将与用户i属于同一社团的朋友子列表定义为list1,将与用户i不属于同一社团的朋友子列表定义为list2;将用户i与list1构成的图定义为G(V,E),其中V是用户集合,E是用户间朋友关系的边集合,将用户i与list2构成的图定义为G'(V',E'),其中V'是用户集合,E'是用户间朋友关系的边集合;计算用户节点i的InnerRank值和OutterRank值。
5.根据权利要求3或4所述的方法,计算用户i的InnerRank值和用户i的OutterRank值具体包括:定义矩阵A为图G的邻接矩阵,则矩阵A中的元素:定义矩阵S为图G的原始转移矩阵,且矩阵S中的元素 其中di为节点i的度;定义矩阵P为图G的转移矩阵,且 其中β为衰减因子,N为图中节点数量,U为N阶矩阵,且Uij=1;求解矩阵P的特征向量q=Pq,当q不断迭代后最终收敛时,节点i的PageRank值即为特征向量q中对应维的值。
6.一种社交网络中基于相似社团的好友推荐系统,其特征在于,该系统包括:数据源获取模块、社团发现模块、社团间相似度计算模块、社团角色发现模块、生成好友推荐集模块,获取数据源信息模块获取包括标签在内的用户信息、用户朋友关系的社交信息;社团发现模块寻找社交网络中的社交社团;社团间相似度计算模块计算社团间结构相似度和属性相似度,根据公式:Simi,j=α·ti,j+(1-α)·fi,j线性组合得到社团间相似度Simi,j,其中,ti,j表示社团i与社团j的结构相似度,fi,j表示属性相似度,α为调节参数,取0到1之间的任意值,根据相似度排序生成Top-N相似社团集,所述计算社团间结构相似度具体为:根据社团相邻边占两个社团所有边的比值获得社团间结构相似度,所述计算社团间属性相似度具体为:利用社团中用户的标签将社团属性划分为不同类型,并将社团属于各类型的概率表示为特征向量,社团划分类型集合定义为C={C1,C2,C3...,Cn},n为社团类型个数,社团中所有用户的标签构成社团标签集,如社团i有m个属性,形成属性向量为 分类器根据公式: 对社团每一个类型Ck的社团属性进
行分类,其中,θ∈{0,1},k∈{1,2...,n},i∈{1,2...,m};将社团属于不同类型的概率用特征向量fi来表现,即fi=(i1,i2...,in),其中ik=p(Ck=1|Xi)表示社团i属于类型Ck的概率;
根据公式 计算社团i与目标社团j特征向量的余
弦相似度,得到各社团与目标社团的属性相似度;社团用户角色发现模块利用用户节点在社团中的拓扑结构将用户分类,定义节点在网络中的角色,拥有相似的结构的用户节点占据网络中的相同角色,通过分析用户节点在自身社团中以及其它社团中的角色地位来定义节点在网络中的角色;生成好友推荐集模块为目标社团的各类用户提供Top-N相似社团中相对应的同类或多类的好友推荐集;寻找社交网络中的社交社团具体包括:将每个用户初始化为一个独立社团,依次合并存在朋友关系的社团对,根据公式: 计算合并后的模块度增量值,直到模块度值最大化,寻找到社交社团,其中,A为邻接矩阵,当节点i与节点j在同一个社团时,δ(σi,σj)=1否
则为0,ki为节点i的度,m为网络的总边数。
7.根据权利要求6所述的系统,其特征在于,计算社团间结构相似度具体包括:根据公式 计算社团i与社团j的结构相似度ti,j,其中,ei,j表示社团i中点vi与社团j中的点vj构成的边,ei表示社团i中的边,ej表示社团j中的边。
8.根据权利要求6所述的系统,其特征在于,拥有相似结构的节点占据网络中的相同角色,基于社团结构的二维网页排名度量,内排名InnerRank度量节点和与该节点在同一社团中与其它节点连接的紧密性,外排名OutterRank度量其它社团中连向节点的边分布的数量,根据内排名、外排名两个影响力的度量维度,将网络的节点划分成三种角色:核心点、重要点以及普通点。
9.根据权利要求8所述的系统,其特征在于,二维网页排名度量方法具体包括步骤:将与用户i属于同一社团的朋友子列表定义为list1,将与用户i不属于同一社团的朋友子列表定义为list2;将用户i与list1构成的图定义为G(V,E),其中V是用户集合,E是用户间朋友关系的边集合,将用户i与list2构成的图定义为G'(V',E'),其中V'是用户集合,E'是用户间朋友关系的边集合;计算节点i的InnerRank值和用户i的OutterRank值。
10.根据权利要求8或9所述的系统,计算用户i的InnerRank值和用户i的OutterRank值具体包括:定义矩阵A为图G的邻接矩阵,则矩阵A中的元素:定义矩阵S为图G的原始转移矩阵,且 其中di为节点i的度;定义矩阵P为图G的转移矩阵,且 其中β为衰减因子,N为图中节点数量,U为N阶矩阵,且Uij=1;求解矩阵P的特征向量q=Pq,当q不断迭代后最终收敛时,节点i的PageRank值即为特征向量q中对应维的值。