1.基于人工智能的数据冷热分层自适应存储优化方法,其特征在于,包括:
采集存储设备中每个存储数据的存储时序信息,所述存储时序信息包括访问频率、隐私类型、数据新颖性指数与冷热状态,冷热状态包括冷状态与热状态;
将存储时序信息输入至冷热状态预测模型中,预测未来时间存储数据的冷热状态;
采集存储数据的单位周期内访问频率;
将单位周期内访问频率建立访问频率分析集合,并提取访问频率特征;
将访问频率特征输入阶段性数据识别模型中,获得阶段性判断结果,阶段性判断结果包括是或否;
根据存储数据的阶段性判断结果与预测未来时间存储数据的冷热状态,判定是否对所述存储数据进行迁移,若不进行迁移判断是否进行备份。
2.根据权利要求1所述的基于人工智能的数据冷热分层自适应存储优化方法,其特征在于,判定是否对所述存储数据进行迁移的方法包括:若所述存储数据当前存储在热数据存储介质上,预测未来时间存储数据的热状态,阶段性判断结果为是或否,则不对所述存储数据进行迁移;
若所述存储数据当前存储在热数据存储介质上,预测未来时间存储数据的冷状态,阶段性判断结果为是,则不对所述存储数据进行迁移;
若所述存储数据当前存储在热数据存储介质上,预测未来时间存储数据的冷状态,阶段性判断结果为否,则将所述存储数据迁移至冷数据存储介质上;
若所述存储数据当前存储在冷数据存储介质上,预测未来时间存储数据的冷状态,阶段性判断结果为否或是,则不对所述存储数据进行迁移;
若所述存储数据当前存储在冷数据存储介质上,预测未来时间存储数据的热状态,阶段性判断结果为否,则将所述存储数据迁移至热数据存储介质上。
3.根据权利要求2所述的基于人工智能的数据冷热分层自适应存储优化方法,其特征在于,若不进行迁移判断是否进行备份的方法包括:若所述存储数据当前存储在冷数据存储介质上,预测未来时间存储数据的热状态,阶段性判断结果为是,则将所述存储数据备份至热数据存储介质上,并将所述存储数据访问接口切换至热数据存储介质;当在下一次预测未来时间存储数据为冷状态时,将所述存储数据在热数据存储介质的备份删除,将所述存储数据访问接口切换至冷数据存储介质。
4.根据权利要求1所述的基于人工智能的数据冷热分层自适应存储优化方法,其特征在于,数据新颖性指数根据存储数据采集时间与当前时间的差值倒数、存储数据与其他数据的相似度均值、存储数据类型多样性指数综合分析生成。
5.根据权利要求1所述的基于人工智能的数据冷热分层自适应存储优化方法,其特征在于,存储数据类型多样性指数使用熵来衡量存储数据中类别的多样性。
6.根据权利要求2所述的基于人工智能的数据冷热分层自适应存储优化方法,其特征在于,所述冷热状态预测模型的构建方法包括:预设预测时间步长T、滑动步长P2以及滑动窗口长度P1;将存储时序信息使用滑动窗口方法将其转化为多个训练样本,一个训练样本对应一个标签,并构成一组训练数据,P1、P2均为大于1的整数;
将训练数据作为冷热状态预测模型的输入,预测时间步长T后的存储数据的冷热状态作为输出,以每个时间步长T后的未来时间实际存储数据的冷热状态作为预测目标,以预测准确率作为训练目标,对冷热状态预测模型进行训练,得到满足预测准确率的冷热状态预测模型,所述冷热状态预测模型为时间卷积网络、长短期记忆网络或门控循环单元。
7.根据权利要求6所述的基于人工智能的数据冷热分层自适应存储优化方法,其特征在于,阶段性数据识别模型的训练方法包括:收集V组识别数据,V为大于1的整数,识别数据包括访问频率特征以及访问频率特征对应的阶段性判断结果,所述访问频率特征包括访问频率变化时序数据、频率均值与频率标准差;
将每组识别数据的向量作为阶段性数据识别模型的输入,所述阶段性数据识别模型以每组访问频率特征预测对应的阶段性判断结果作为输出,以每组访问频率特征实际对应的阶段性判断结果作为预测目标;以最小化所有访问频率特征对应的阶段性判断结果的预测误差之和作为训练目标;对阶段性数据识别模型进行训练,直至预测误差之和达到收敛时停止训练,所述阶段性数据识别模型为回归预测模型。
8.根据权利要求7所述的基于人工智能的数据冷热分层自适应存储优化方法,其特征在于,所述访问频率变化时序数据的获得方法包括:将访问频率分析集合中相邻的访问频率之差除以采集时间靠前的访问频率,得到访问频率变化,以此类推依次计算相邻的访问频率的访问频率变化,所有的访问频率变化构成访问频率变化时序数据。
9.根据权利要求7所述的基于人工智能的数据冷热分层自适应存储优化方法,其特征在于,所述频率均值为访问频率分析集合内访问频率的均值;所述频率标准差为访问频率分析集合内访问频率的标准差。
10.基于人工智能的数据冷热分层自适应存储优化系统,其特征在于,用于实现权利要求1-9任一项所述的基于人工智能的数据冷热分层自适应存储优化方法,系统包括:第一采集模块,用于采集存储设备中每个存储数据的存储时序信息,所述存储时序信息包括访问频率、隐私类型、数据新颖性指数与冷热状态,冷热状态包括冷状态与热状态;
第一分析模块,用于将存储时序信息输入至冷热状态预测模型中,预测未来时间存储数据的冷热状态;
第二采集模块,用于采集存储数据的单位周期内访问频率;
特征提取模块,用于将单位周期内访问频率建立访问频率分析集合,并提取访问频率特征;
第二分析模块,将访问频率特征输入阶段性数据识别模型中,获得阶段性判断结果,阶段性判断结果包括是或否;
综合分析模块,根据存储数据的阶段性判断结果与预测未来时间存储数据的冷热状态,判定是否对所述存储数据进行迁移,若不进行迁移判断是否进行备份。