1.一种计算机大数据存储控制系统,其特征在于:该系统包括数据处理模块、数据管理模块、云储存模块和云数据下载模块;
所述数据处理模块用于接收大数据处理任务信息,并对任务数据进行分析处理;所述数据管理模块用于储存和删除本地大数据,将本地大数据备份后发送给云端;所述云储存模块用于储存和管理云端大数据;所述云数据下载模块用于下载或删除与任务数据相关的云端大数据,方便计算机直接访问;
其中,储存大数据包括本地大数据和云端大数据。
2.根据权利要求1所述的一种计算机大数据存储控制系统,其特征在于:所述数据处理模块包含任务数据获取单元和处理数据单元;
所述任务数据获取单元用于接收大数据处理任务和任务数据;
所述处理数据单元用于对任务数据进行处理,分析任务数据相关特征,预测用户所需要的储存大数据。
3.根据权利要求1所述的一种计算机大数据存储控制系统,其特征在于:所述数据管理模块包含数据储存单元、数据删除单元和数据备份单元;
所述数据储存单元用于储存本地大数据,并记录本地大数据储存量、每条数据的存储时间和每条数据储存应用程序位置信息;
所述数据删除单元用于删除储存的本地大数据;
所述数据备份单元用于将本地的储存大数据进行备份并发送给云端。
4.根据权利要求1所述的一种计算机大数据存储控制系统,其特征在于:所述云储存模块包含云端数据储存单元和云端数据管理单元;
所述云端数据储存单元用于储存云端大数据,接收计算机本地发送的储存大数据并根据储存大数据中的应用程序位置信息对储存大数据进行分类储存;
所述云端数据管理单元用于搜寻云端中和任务数据相关联的云端大数据。
5.根据权利要求1所述的一种计算机大数据存储控制系统,其特征在于:所述云数据下载模块包含云端数据下载单元和云端数据删除单元;
所述云端数据下载单元用于下载云端中与任务数据相关联的云端大数据;
所述云端数据删除单元用于检测计算机工作状态,删除从云端下载的大数据。
6.一种计算机大数据存储控制方法,其特征在于:该方法包括以下步骤:S10、用户进入计算机中的应用程序w,计算机不断获取应用程序w中的大数据处理任务,分析任务数据相关特征,预测用户所需要的a标签数据;
S20、云数据下载模块下载云端中的a标签数据,供计算机直接访问;
S30、随着任务数据的不断分析,云数据下载模块中下载的a标签数据不断更新;
S40、大数据处理任务结束,将云数据下载模块中的a标签数据删除;
其中,每条储存大数据分别对应a标签或b标签;a标签表示和任务数据相关的储存大数据;b标签表示和任务数据不相关的储存大数据;储存大数据包括本地大数据和云端大数据;云数据下载模块用于下载云端大数据中的a标签数据,删除从云端下载的a标签数据。
7.根据权利要求6所述的一种计算机大数据存储控制方法,其特征在于:计算机获取大数据处理任务,根据任务数据特征预测用户所需要的a标签数据的方法步骤为:S101、通过分析应用程序w内储存大数据的数据种类和数据来源得到w内储存大数据的所有特征;通过分析应用程序w内每个特征对应的本地大数据量在应用程序w内所有特征对应的本地大数据量中的比值,确定每个特征的权重;
S102、通过步骤S101中分析数据,得到用于特征筛选集合的A;其中,A={m1、m2、m3、...、mp};m1=(X1,x1)、m2=(X2,x2)、m3=(X3,x3)、...、mp=(Xp,xp);Xi表示应用程序w内的具体特征;xi表示对应Xi特征的权重;
S103、通过分析任务数据得到用户计算机界面呈现的数据信息特征和每种特征所占计算机界面面积;通过每种特征所占计算机界面面积在计算机界面总面积的比值来计算每种特征的权重;
S104、通过步骤S103中分析数据,得到任务数据的特征合集B;其中,B={n1、n2、n3、...、nq};n1=(Y1,y1)、n2=(Y2,y2)、n3=(Y3,y3)、...、np=(Yq,yq);Yi表示任务数据具体特征;yi表示对应Yi特征的权重;
S105、采用RFE算法,以集合A中的特征变量建立模型,将集合B与集合A做交叉验证,剔除合集A中的弱特征变量,得到当前预测用户所需要的a标签数据特征集合C;其中,C={d1、d2、d3、...、dq‑1};d1=(Z1,z1)、d2=(Z2,z2)、d3=(Z3,z3)、...、dq‑1=(Zq‑1,zq‑1);Zi表示剔除弱特征变量后任务数据具体特征;zi表示对应Zi特征的权值;
S106、以当前预测的用户所需要的a标签数据特征合集再次建立模型;随着任务数据信息的更新,集合C也在不断更新;其中,集合C更新的方法为:将新的任务数据的特征合集与集合C做交叉验证,剔除集合C中弱特征变量,得到更新后的合集C;
S107、重复步骤S106,直到集合C中只有一个特征,即为预测的a标签数据;
其中,不含a标签数据特征集合特征的储存大数据为b标签数据;弱特征变量表示交叉验证后分数最差的特征;通过用户每次屏幕的点击来划分任务数据。
8.根据权利要求7所述的一种计算机大数据存储控制方法,其特征在于:在任务数据分析的过程中,根据集合C云数据下载模块从云端下载a标签数据并不断更新的方法为:S201、云数据下载模块根据合集C中各个特征量和权重值,按比例从云端下载相关的a标签数据;
S202、当合集C中的弱特征变量被剔除时,云数据下载模块将下载的与剔除的弱特征变量相关的a标签数据删除;
S203、云数据下载模块按照a标签数据储存的历史时间,先下载云端中存储时间更短的a标签数据;
其中,a标签数据包含与集合C相关特征的所有储存数据。
9.根据权利要求6所述的一种计算机大数据存储控制方法,其特征在于:设置计算机大数据存储量阈值K,当计算机大数据存储量达到阈值时,清理对应b标签的本地大数据,方法步骤为:S301、记录每条本地大数据的储存时间;
S302、计算云数据下载模块单位时间内云端大数据下载量和删除量的差值X1‑X2;
S303、根据云数据下载模块单位时间内云端大数据下载量和删除量的差值,先删除本地大数据中储存时间更长的b标签数据;
其中,K为计算机的本地大数据最大储存量阈值;X1表示云数据下载模块单位时间内云端大数据下载量;X2表示云数据下载模块单位时间内云端大数据删除量。
10.根据权利要求9所述的一种计算机大数据存储控制方法,其特征在于:用户可手动将本地储存大数据改为不可删除数据;当本地储存大数据改成不可删除数据时,该不可删除数据计算机无法自动删除。