欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2019106602337
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种数据一致性的检测方法,其特征在于,所述方法包括:获取两版本图谱,确定各实体在所述两版本图谱中的第一属性信息和第二属性信息;

将同一实体的所述第一属性信息和所述第二属性信息比对,以确定相应实体各属性项的属性值更新类型;

对各属性项,根据所述更新类型进行统计,得到属性值属于相应更新类型的实体数量;

根据对属性项统计得到的属于各更新类型的实体数量,生成一致性报告;

所述两版本图谱包括第一图谱和第二图谱,所述将同一实体的所述第一属性信息和所述第二属性信息比对,以确定相应实体各属性项的属性值更新类型之前,还包括:若同一实体的标识在所述两版本图谱中存在差异,生成所述两版本图谱中标识的变更关系,以根据所述变更关系,修改所述第一图谱或所述第二图谱的标识。

2.根据权利要求1所述的检测方法,其特征在于,所述生成所述两版本图谱中标识的变更关系,以根据所述变更关系,修改所述第一图谱或所述第二图谱的标识,包括:若所述第一图谱中实体的第一标识变化为所述第二图谱中的第二标识,生成所述第一图谱中的第一标识和所述第二图谱中的第二标识之间的变更关系;

根据所述变更关系,将所述第一图谱中的所述第一标识修改为所述第二标识,或者,将所述第二图谱中的所述第二标识修改为所述第一标识。

3.根据权利要求1所述的检测方法,其特征在于,所述生成不同版本图谱中标识的变更关系,以根据所述变更关系,修改所述第一图谱或所述第二图谱的标识,包括:若所述第一图谱中第一标识的实体和第二标识的实体融合为所述第二图谱中第一标识的实体,生成所述第一图谱中的第二标识和所述第二图谱中第一标识之间的变更关系;

根据所述第一图谱中的第二标识和所述第二图谱中第一标识之间的变更关系,对所述第二图谱中具有所述第一标识的实体复制属性信息,将复制的属性信息对应实体的标识修改为所述第二标识。

4.根据权利要求1所述的检测方法,其特征在于,所述生成不同版本图谱中标识的变更关系,以根据所述变更关系,修改所述第一图谱或所述第二图谱的标识,包括:若所述第一图谱中具有第二标识的实体拆分为所述第二图谱中第一标识的实体和第二标识的实体,生成所述第一图谱中的第二标识和所述第二图谱中第一标识之间的变更关系;

根据所述第一图谱中的第二标识和所述第二图谱中第一标识之间的变更关系,对所述第一图谱中具有所述第二标识的实体复制属性信息,将复制的属性信息对应实体的标识修改为所述第一标识。

5.根据权利要求1‑4任一项所述的检测方法,其特征在于,所述将同一实体的所述第一属性信息和所述第二属性信息比对之前,还包括:根据实体的标识,对各版本图谱进行归并分桶处理,以得到各版本图谱的数据桶;其中,每一个版本图谱的数据桶为多个,每一个数据桶与实体的标识对应,用于存储对应实体的属性信息。

6.根据权利要求5所述的检测方法,其特征在于,所述将同一实体的所述第一属性信息和所述第二属性信息比对,包括:从各版本图谱的数据桶中,获取对应同一标识的数据桶;所述数据桶中存储的属性信息包括多个层级的属性,每一层级属性包括至少一个属性项和对应的属性值;

对所述对应同一标识的数据桶,根据属性层级顺序,对比相应属性层级内的属性项和对应的属性值,得到所述更新类型;

其中,所述更新类型包括属性值增加、属性值减少、属性值修改和维持不变中的一个或多个组合。

7.根据权利要求6所述的检测方法,其特征在于,所述对比相应属性层级内的属性项和对应的属性值之前,还包括:

根据用户设置,确定待比对的属性项。

8.根据权利要求1所述的检测方法,其特征在于,所述根据所述更新类型进行统计,得到属性值属于相应更新类型的实体数量之后,还包括:获取用户设定的阈值计算策略;

采用所述阈值计算策略,对历史数据中的实体数量进行计算,以确定阈值;

若所述实体数量与所述阈值不匹配,生成提示信息。

9.根据权利要求1所述的检测方法,其特征在于,所述将同一实体的所述第一属性信息和所述第二属性信息比对之后,还包括:获取同一实体的所述第一属性信息和所述第二属性信息之间的属性差异;所述属性差异,用于指示各属性项的异同以及对应属性值的异同;

根据所述属性差异,生成所述一致性报告。

10.一种数据一致性的检测装置,其特征在于,所述装置包括:获取模块,用于获取两版本图谱,确定各实体在所述两版本图谱中的第一属性信息和第二属性信息;

比对模块,用于将同一实体的所述第一属性信息和所述第二属性信息比对,以确定相应实体各属性项的属性值更新类型;

统计模块,用于对各属性项,根据所述更新类型进行统计,得到属性值属于相应更新类型的实体数量;

生成模块,用于根据对属性项统计得到的属于各更新类型的实体数量,生成一致性报告;

所述两版本图谱包括第一图谱和第二图谱,所述装置还包括:修改模块,用于若同一实体的标识在所述两版本图谱中存在差异,生成所述两版本图谱中标识的变更关系,以根据所述变更关系,修改所述第一图谱或所述第二图谱的标识。

11.根据权利要求10所述的检测装置,其特征在于,所述修改模块,具体用于:若所述第一图谱中实体的第一标识变化为所述第二图谱中的第二标识,生成所述第一图谱中的第一标识和所述第二图谱中的第二标识之间的变更关系;

根据所述变更关系,将所述第一图谱中的所述第一标识修改为所述第二标识,或者,将所述第二图谱中的所述第二标识修改为所述第一标识。

12.根据权利要求10所述的检测装置,其特征在于,所述修改模块,具体用于:若所述第一图谱中第一标识的实体和第二标识的实体融合为所述第二图谱中第一标识的实体,生成所述第一图谱中的第二标识和所述第二图谱中第一标识之间的变更关系;

根据所述第一图谱中的第二标识和所述第二图谱中第一标识之间的变更关系,对所述第二图谱中具有所述第一标识的实体复制属性信息,将复制的属性信息对应实体的标识修改为所述第二标识。

13.根据权利要求10所述的检测装置,其特征在于,所述修改模块,具体用于:若所述第一图谱中具有第二标识的实体拆分为所述第二图谱中第一标识的实体和第二标识的实体,生成所述第一图谱中的第二标识和所述第二图谱中第一标识之间的变更关系;

根据所述第一图谱中的第二标识和所述第二图谱中第一标识之间的变更关系,对所述第一图谱中具有所述第二标识的实体复制属性信息,将复制的属性信息对应实体的标识修改为所述第一标识。

14.根据权利要求10‑13任一项所述的检测装置,其特征在于,所述装置还包括:归并模块,用于根据实体的标识,对各版本图谱进行归并分桶处理,以得到各版本图谱的数据桶;其中,每一个版本图谱的数据桶为多个,每一个数据桶与实体的标识对应,用于存储对应实体的属性信息。

15.根据权利要求14所述的检测装置,其特征在于,所述比对模块,具体用于:从各版本图谱的数据桶中,获取对应同一标识的数据桶;所述数据桶中存储的属性信息包括多个层级的属性,每一层级属性包括至少一个属性项和对应的属性值;

对所述对应同一标识的数据桶,根据属性层级顺序,对比相应属性层级内的属性项和对应的属性值,得到所述更新类型;

其中,所述更新类型包括属性值增加、属性值减少、属性值修改和维持不变中的一个或多个组合。

16.根据权利要求15所述的检测装置,其特征在于,所述比对 模块,还用于:根据用户设置,确定待比对的属性项。

17.根据权利要求10所述的检测装置,其特征在于,所述装置还包括:处理模块,用于获取用户设定的阈值计算策略;采用所述阈值计算策略,对历史数据中的实体数量进行计算,以确定阈值;若所述实体数量与所述阈值不匹配,生成提示信息。

18.根据权利要求10所述的检测装置,其特征在于,所述生成模块,还用于:获取同一实体的所述第一属性信息和所述第二属性信息之间的属性差异;所述属性差异,用于指示各属性项的异同以及对应属性值的异同;

根据所述属性差异,生成所述一致性报告。

19.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1‑9中任一所述的数据一致性的检测方法。

20.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑9中任一所述的数据一致性的检测方法。