1.一种基于行为习惯的跨社交网络用户身份识别方法,其特征在于,包括以下步骤:S1:当需要对社交网络A中的用户识别其在社交网络B中的相同账号时,分别从社交网络A和社交网络B中爬取各自用户的显示名称和历史发布内容,记两个社交网络中用户数量分别为NA和NB;
S2:分别计算社交网络A中各个用户i和社交网络B中各个用户j的显示名称相似度史发布内容在第d个主题对应的主题分布值,表示社交网络B中用户j在子时间段Δtk的历史发布内容在第d个主题对应的主题分布值,d=1 ,2,…,D,D表示主题数量,根据实际需要设置;
S3.2:对于社交网络A中用户i,对于每个子时间段Δtk的主题分布向量与其前后两个相邻的主题分布向量之间和之间的相似度,如果相似度均小于预设阈值,则判定该主题分布向量所对应的主题分布为短期的兴趣因子,将此主题分布向量删除,否则认为该主题分布向量所对应的主题分布为长期的兴趣图谱,保留该主题分布向量即不作任何操作;采用相同方法对社交网络B中用户j的主题分布向量进行处理,得到社交网络B中用户j所保留的主题分布向量S3.3:在得到社交网络A中用户i和社交网络B中用户j各自兴趣图谱所包含的主题分布向量后,根据所保留的主题分布向量的子时间段筛选出两个用户共同的子时间段,记共同子时间段数量为K′;然后采用以下公式计算得到兴趣图谱相似度其中,表示社交网络A中用户i在第k′个共同子时间段的主题分布向量,表示社交网络B中用户j在第k′个共同子时间段的主题分布向量,k′=1,2,…,K′;
S4:综合社交网络A中各个用户i和社交网络B中各个用户j显示名称相似度和兴趣图谱相似度进行用户识别,确定社交网络A中的用户在社交网络B中账号。
2.根据权利要求1所述的跨社交网络用户身份识别方法,其特征在于,所述步骤S2.4中权重采用如下方法确定:采用以下公式计算社交网络A中用户i和社交网络B中用户j的第q种特征相似度的熵值其中,采用以下公式计算:
构建变种赋权参数
计算得到权重