欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020101586947
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-12-10
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于文件信息的备份数据分析方法,其特征在于,包括:从数据湖中获取备份数据的文件信息,其中,所述备份数据为生产数据的副本,所述数据湖与生产环境隔离;

将所述文件信息按照数据类型进行分类,得到若干个文件元信息和若干个文件时间信息;

将所述文件元信息按照备份时间进行分割,得到多个子文件元信息;

根据所述备份时间,将各所述子文件元信息顺序输入预先构建的KNN算法模型中,预测得到各所述子文件元信息分别对应的inode数;

调取所述文件元信息和所述文件时间信息分别对应的预设规则,处理各所述inode数和各所述文件时间信息,得到所述文件元信息对应的第一数据轨迹和所述文件时间信息对应的第二数据轨迹;

分别将所述第一数据轨迹和所述第二数据轨迹进行分割、比对,得到所述备份数据的数据轨迹报告。

2.根据权利要求1所述的基于文件信息的备份数据分析方法,其特征在于,所述调取所述文件元信息对应的预设规则,处理各所述inode数,得到所述文件元信息对应的第一数据轨迹的步骤,包括:根据各所述inode数与各所述子文件元信息之间的对应关系,查找得到各所述inode数分别对应的备份时间;

将各所述inode数按照各自对应的所述备份时间进行顺序排列,得到所述文件元信息对应的所述第一数据轨迹。

3.根据权利要求1所述的基于文件信息的备份数据分析方法,其特征在于,所述调取所述文件时间信息对应的预设规则,处理各所述文件时间信息,得到所述文件时间信息对应的第二数据轨迹的步骤,包括:将所述文件时间信息按照时间类型进行分类,得到若干个子文件时间信息;

将各所述子文件时间信息以时间为基准绘制散点图,得到所述文件时间信息对应的所述第二数据轨迹。

4.根据权利要求1所述的基于文件信息的备份数据分析方法,其特征在于,所述分别将所述第一数据轨迹和所述第二数据轨迹进行分割、比对,得到所述备份数据的数据轨迹报告的步骤,包括:分别将所述第一数据轨迹和所述第二数据轨迹按照第一预设时间段进行分割,得到若干个分段时间轨迹;

将属于同一所述数据类型的各所述分段时间轨迹进行比对,生成所述数据轨迹报告。

5.根据权利要求2或3所述的基于文件信息的备份数据分析方法,其特征在于,所述调取所述文件元信息和所述文件时间信息分别对应的预设规则,处理各所述inode数和各所述文件时间信息,得到所述文件元信息对应的第一数据轨迹和所述文件时间信息对应的第二数据轨迹的步骤之后,包括:分别根据所述第一数据轨迹和所述第二数据轨迹的变化幅度,判断所述第一数据轨迹和/或所述第二数据轨迹中是否存在异常反馈点,其中,所述异常反馈点为所述第一数据轨迹和/或所述第二数据轨迹中,当前的变化幅度大于正常幅度的文件信息;

若存在异常反馈点,则在所述第一数据轨迹和/或所述第二数据轨迹中将所述异常反馈点以预设格式进行标记,并输出预设信息,以提醒用户所述异常反馈点的存在。

6.根据权利要求5所述的基于文件信息的备份数据分析方法,其特征在于,所述根据所述第一数据轨迹的变化幅度,判断所述第一数据轨迹中是否存在异常反馈点的步骤,包括:计算所述第一数据轨迹中,所有相邻的两个所述inode数之间的差值,得到若干个变化值;

计算所有相邻两个所述变化值之间的差值,得到多个变化差值;

判断是否从各所述变化差值中,能够筛选得到至少一个大于预设差值的所述变化差值;

若能够筛选得到至少一个大于预设差值的所述变化差值,则判定所述第一数据轨迹中存在异常反馈点;

若不能够筛选到至少一个大于预设差值的所述变化值,则判定所述第二数据轨迹中不存在异常反馈点。

7.根据权利要求5所述的基于文件信息的备份数据分析方法,其特征在于,所述根据所述第二数据轨迹的变化幅度,判断所述第二数据轨迹中是否存在异常反馈点的步骤,还包括:将所述第二数据轨迹按照第二预设时间段进行分割,得到若干个散点图区域;

分别比对相邻两个所述散点图区域中散点的密集度,判断相邻两个所述密集度的差异程度是否在预设范围内;

若相邻两个所述密集度的差异程度是在预设范围内,则判定所述第二数据轨迹中不存在异常反馈点;

若相邻两个所述密集度的差异程度不在预设范围内,则判定所述第二数据轨迹中存在异常反馈点。

8.一种基于文件信息的备份数据分析装置,其特征在于,包括:获取模块,用于从数据湖中获取备份数据的文件信息,其中,所述备份数据为生产数据的副本,所述数据湖与生产环境隔离;

分类模块,用于将所述文件信息按照数据类型进行分类,得到若干个文件元信息和若干个文件时间信息;

分割模块,用于将所述文件元信息按照备份时间进行分割,得到多个子文件元信息;

预测模块,用于根据所述备份时间,将各所述子文件元信息顺序输入预先构建的KNN算法模型中,预测得到各所述子文件元信息分别对应的inode数;

处理模块,用于调取所述文件元信息和所述文件时间信息分别对应的预设规则,处理各所述inode数和各所述文件时间信息,得到所述文件元信息对应的第一数据轨迹和所述文件时间信息对应的第二数据轨迹;

生成模块,用于分别将所述第一数据轨迹和所述第二数据轨迹进行分割、比对,得到所述备份数据的数据轨迹报告。

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。