1.一种大数据信息关键域数据信息提取的方法,其特征在于,包括:
获取不同岗位的所有新员工对应的培训数据,并根据所有培训数据对不同岗位对应的新员工整体培训状态进行处理分析,得到若干目标岗位以及若干目标培训数据;
对处理获取的所有目标岗位实施未入职原因维度的数据处理和提取,得到对应维度的第一异常影响识别提取集;
对处理获取的所有目标培训数据实施失败数据项维度的数据处理和提取,得到对应维度的第二异常影响识别提取集;
将处理获取的第一异常影响识别提取集和第二异常影响识别提取集分别推送至监管人员处,并实施针对性的培训异常提取分析提示。
2.根据权利要求1所述的一种大数据信息关键域数据信息提取的方法,其特征在于,对不同岗位对应的所有培训数据实施不同方式的培训监管处理时,依次获取不同岗位的所有培训数据中对应的培训人员姓名、性别、学历、培训开始时间点、培训结束时间点和培训结果;
对不同岗位的所有新员工对应的培训数据实施培训结果维度的处理提取时,依次获取不同岗位的不同培训数据中的培训结果并遍历分析;
若培训结果为正常入职,则生成局部培训成功指令并将所属岗位的培训成功总人数CPi加一;i为不同的岗位,i=1,2,3,……,n;n为正整数;
若培训结果为未入职,则生成局部培训失败指令并将所属岗位的培训失败总人数SPi加一。
3.根据权利要求2所述的一种大数据信息关键域数据信息提取的方法,其特征在于,对不同岗位对应的新员工整体培训状态进行处理分析时,将不同岗位对应的培训成功总人数CPi和培训失败总人数SPi通过培训状态识别函数进行数据计算,并输出不同岗位对应的整体培训标识ZPi;
其中,培训状态识别函数的表达式为式中,PB为不同岗位对应的整体培训要求标准值;
整体培训标识包含0或1的数值,表示对应岗位的新员工整体培训状态正常或异常;
根据数值为1的整体培训标识将对应的岗位标记为目标岗位,以及将所有目标岗位中未入职的培训结果所属培训数据标记为目标培训数据。
4.根据权利要求3所述的一种大数据信息关键域数据信息提取的方法,其特征在于,获取所有目标岗位中未入职的培训结果对应的未入职原因,对所有未入职原因进行分类标记;
若未入职原因为员工个人原因,则将所属未入职员工标记为第一未入职员工;
若未入职原因为非员工个人原因,则将所属未入职原因标记为第二未入职员工;
获取所有第二未入职员工对应的所有未入职原因,并将所有未入职原因进行排序组合,并对排序组合的所有相同未入职原因进行去重处理,以及将不同未入职原因对应出现的总次数进行统计更新,得到未入职原因统计表。
5.根据权利要求4所述的一种大数据信息关键域数据信息提取的方法,其特征在于,根据未入职原因统计表对不同未入职原因对应的异常原因影响进行数据处理时,将不同未入职原因对应出现的总次数依次通过公式计算获取对应的异常原因影响度DYj;式中,NYj为不同未入职原因对应出现的总次数;j为不同的未入职原因,j=1,2,3,……,m;m为正整数;B为异常原因影响标准值。
6.根据权利要求5所述的一种大数据信息关键域数据信息提取的方法,其特征在于,对异常原因影响度进行数据分析确定不同未入职原因对应的异常原因影响时;
若异常原因影响度为0,则生成异常原因常规影响指令,并将所属未入职原因标记为常规未入职原因;
若异常原因影响度不为0,则生成异常原因特殊影响指令,并将所属未入职原因标记为特殊未入职原因;
将所有分析标记的特殊未入职原因进行排序组合,得到第一异常影响识别提取集。
7.根据权利要求6所述的一种大数据信息关键域数据信息提取的方法,其特征在于,对所有目标培训数据中的不同数据项分别进行数据统计,得到对应的失败性别统计序列、失败学历统计序列、失败培训持续时长统计序列;
对不同统计序列进行不同元素的异常识别提取时,将不同统计序列中的不同元素依次通过公式计算获取对应元素的元素影响占比YLk;式中,YZk为不同统计序列中的不同元素数值;k为不同统计序列中的不同元素,k=1,2,3,……,p;p为正整数,为所属统计序列中的元素总数。
8.根据权利要求7所述的一种大数据信息关键域数据信息提取的方法,其特征在于,计算统计序列中不同元素之间元素影响占比的差值并标记为元素影响差YC,根据元素影响差确定不同元素之间的异常数据项影响状态时,将统计序列中不同元素影响差通过元素影响识别函数进行数据计算并输出对应的异常数据项影响度YX;
其中,元素影响识别函数的表达式为式中,YC0为标准元素影响差;
异常数据项影响度包含0或1的数值,表示对应元素之间的异常数据项影响状态正常或异常。
9.根据权利要求8所述的一种大数据信息关键域数据信息提取的方法,其特征在于,根据数值为1的异常数据项影响度将所属两个计算元素中的最大值元素标记为高异常影响数据项;
将所有高异常影响数据项进行排序组合,得到第二异常影响识别提取集。
10.根据权利要求7所述的一种大数据信息关键域数据信息提取的方法,其特征在于,失败性别统计序列包含女生培训失败总数和男生培训失败总数;
失败学历统计序列包含大专培训失败总数、本科培训失败总数和硕士培训失败总数;
失败培训持续时长统计序列包含第一持续时长失败总数、第二持续时长失败总数和第三持续时长失败总数。