1.一种基于大数据分析的企业考勤管理系统,其特征在于,包括数据收集模块(100)、数据分析模块(200)和考勤管理模块(300),其中:所述数据收集模块(100)收集员工考勤记录;
所述数据分析模块(200)用于分析员工考勤记录,根据员工考勤记录,构建孤立森林算法模型,其中孤立森林算法模型包括多颗孤立树;计算每个员工数据在所有孤立树的最短路径长度以及平均路径长度;根据最短路径长度以及平均路径长度,计算出每个数据点的异常得分;根据异常得分的大小确定员工考勤是否异常,并根据最短路径长度,确定员工考勤记录中的异常特征;
所述考勤管理模块(300)用于根据员工考勤记录中的异常特征,生成异常考勤报告,并提供管理建议。
2.根据权利要求1所述的基于大数据分析的企业考勤管理系统,其特征在于,所述数据收集模块(100)从不同数据源收集员工考勤记录,其中员工考勤记录包括多个考勤特征。
3.根据权利要求2所述的基于大数据分析的企业考勤管理系统,其特征在于,所述数据分析模块(200)包括模型构建单元(201),所述模型构建单元(201)构建孤立森林算法模型的过程具体包括:从员工考勤记录中的不同考勤特征中随机选择一个考勤特征,在选定考勤特征的值范围内随机选择一个分割点;
根据分割点将数据集分成两个子集,一个子集包含特征值小于分割点的数据点,另一个子集包含特征值大于或等于分割点的数据点;
对每个子集递归执行上述步骤,直到子集中的数据点数小于预设阈值或达到最大树深度;
根据上述步骤,重复构建多棵孤立树,形成孤立森林。
4.根据权利要求3所述的基于大数据分析的企业考勤管理系统,其特征在于,所述数据分析模块(200)包括路径分析单元(202),所述路径分析单元(202)计算路径长度的过程具体包括:对于孤立森林中的每棵孤立树,输入每个员工考勤记录数据点;
从根节点开始,根据特征和分裂点递归地将数据点分配到相应的子节点,直到数据点到达叶节点;
记录数据点从根节点到叶节点所经过的路径长度;
将每个员工考勤记录数据点在所有孤立树中的路径长度存储在一个矩阵中,得到路径长度矩阵,矩阵的行对应数据点,列对应孤立树。
5.根据权利要求4所述的基于大数据分析的企业考勤管理系统,其特征在于,所述路径分析单元(202)计算最短路径长度是从路径长度矩阵的对应行中找出最小值,以确定每个员工考勤记录数据点在所有孤立树中的最短路径。
6.根据权利要求5所述的基于大数据分析的企业考勤管理系统,其特征在于,所述路径分析单元(202)计算平均路径长度是从路径长度矩阵的对应行中计算所有路径长度的平均值,通过将提取的路径长度求和,然后除以孤立树的数量。
7.根据权利要求6所述的基于大数据分析的企业考勤管理系统,其特征在于,所述数据分析模块(200)包括异常得分计算单元(203),所述异常得分计算单元(203)异常得分的计算过程具体包括:将最短路径长度和平均路径长度结合,形成综合路径长度,使用加权和的方法进行计算,公式如下:,其中表示综合路径长度,表示最短路径长度;表示平均路径长度;和分别表示最短路径长度和平均路径长度的权重;
每个员工考勤记录数据点的异常得分计算公式如下:
,其中表示异常得分,表示是孤立树的期望路径长度的常数,为;
其中,为数据点的数量。
8.根据权利要求7所述的基于大数据分析的企业考勤管理系统,其特征在于,所述数据分析模块(200)包括异常分析单元(204),所述异常分析单元(204)确定员工考勤记录中的异常特征的过程具体包括:对所有员工考勤记录数据点的异常得分进行统计,使用分位数方法确定异常阈值,异常阈值用于区分正常点和异常点;将大于异常阈值的异常得分所对应的员工考勤记录数据点作为异常数据点;并根据该异常数据点所对应的最短路径长度,找到孤立森林中对应的孤立树,作为异常特征孤立树;
根据异常特征孤立树中最短路径,记录该路径上的特征和分裂点,并记录每个特征在该最短路径中出现的频率,将特征按出现的频率从高到低排序,并选择出现的频率最高的特征作为异常特征。
9.根据权利要求8所述的基于大数据分析的企业考勤管理系统,其特征在于,所述考勤管理模块(300)将每个异常数据点的员工信息、异常得分和异常特征汇总到异常考勤报告中;根据异常特征,生成针对性的管理建议,通过公共数据库中的规则引擎,根据异常特征以及异常特征所出现的频率,生成对应的管理建议。