欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2013107142916
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种挖掘属性和实体关联关系的方法,其特征在于,包括以下步骤:

获取待关联属性;

根据所述待关联属性从多个实体中获得至少一个种子实体,其中,所述根据待关联属性从多个实体中获得至少一个种子实体具体包括:从预设实体库中获取所述多个实体;从总体用户样本群中获取具有所述待关联属性的关联用户样本群;分别获得所述多个实体在所述关联用户样本群中的多个分布差异值,其中,分别获取与所述多个实体相关的多个用户在所述总体用户样本群中的多个第一分布比重;分别获取与所述多个实体相关的多个用户在所述关联用户样本群中的第二分布比重;根据所述第二分布比重和所述第一分布比重获取所述分布差异值;以及根据所述多个分布差异值对所述多个实体进行筛选以获得所述至少一个种子实体;以及获得所述至少一个种子实体的关联实体,并将所述待关联属性与所述至少一个种子实体、所述至少一个种子实体的关联实体相关联。

2.根据权利要求1所述的方法,其特征在于,所述总体用户样本群为多个,分别对应多个网络应用服务,则每个所述实体对应的分布差异值为多个,所述根据多个分布差异值对所述多个实体进行筛选以获得所述至少一个种子实体还包括:根据预设分布差异值筛选规则对所述多个实体进行筛选;或,

创建分布差异值分类器,并根据所述分布差异值分类器对所述多个实体进行筛选。

3.根据权利要求1至2中任一项所述的方法,其特征在于,所述获得至少一个种子实体的关联实体具体包括:分别获取所述至少一个种子实体到具有所述待关联属性的用户样本群之间的第一关联关系;

获取具有所述待关联属性的用户样本群的关联实体群,并获取所述具有所述待关联属性的用户样本群到所述关联实体群之间的第二关联关系;

根据所述第一关联关系和所述第二关联关系分别获取所述至少一个种子实体到所述关联实体群的第三关联关系;以及根据所述第三关联关系对所述关联实体群中的每个所述关联实体进行筛选以获得所述至少一个种子实体的关联实体。

4.一种挖掘属性和实体关联关系的装置,其特征在于,包括:

待关联属性获取模块,用于获取待关联属性;

种子实体获取模块,用于根据所述待关联属性从多个实体中获得至少一个种子实体,其中,所述种子实体获取模块包括:实体获取单元,用于从预设实体库中获取所述多个实体;关联用户样本群获取单元,用于从总体用户样本群中获取具有所述待关联属性的关联用户样本群;分布差异值获取单元,用于分别获得所述多个实体在所述关联用户样本群中的多个分布差异值,其中,所述分布差异值获取单元还具体用于:分别获取与所述多个实体相关的多个用户在所述总体用户样本群中的多个第一分布比重,并分别获取与所述多个实体相关的多个用户在所述关联用户样本群中的第二分布比重,以及根据所述第二分布比重和所述第一分布比重获取所述分布差异值;以及筛选单元,用于根据所述多个分布差异值对所述多个实体进行筛选以获得所述至少一个种子实体;

关联实体获取模块,用于获得所述至少一个种子实体的关联实体;以及

关联模块,用于将所述待关联属性与所述至少一个种子实体、所述至少一个种子实体的关联实体相关联。

5.根据权利要求4所述的装置,其特征在于,所述总体用户样本群为多个,分别对应多个网络应用服务,则每个所述实体对应的分布差异值为多个,所述根据多个分布差异值对所述多个实体进行筛选还包括:根据预设分布差异值筛选规则对所述多个实体进行筛选;或,

创建分布差异值分类器,并根据所述分布差异值分类器对所述多个实体进行筛选。

6.根据权利要求4至5中任一项所述的装置,其特征在于,所述关联实体获取模块包括:第一关联关系获取单元,用于分别获取所述至少一个种子实体到具有所述待关联属性的用户样本群之间的第一关联关系;

第二关联关系获取单元,用于获取具有所述待关联属性的用户样本群的关联实体群,并获取所述具有所述待关联属性的用户样本群到所述关联实体群之间的第二关联关系;

第三关联关系获取单元,用于根据所述第一关联关系和所述第二关联关系分别获取所述至少一个种子实体到所述关联实体群的第三关联关系;以及筛选单元,用于根据所述第三关联关系对所述关联实体群中的每个所述关联实体进行筛选以获得所述至少一个种子实体的关联实体。