欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020111042732
申请人: 长安大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种针对多维高速公路收费数据的异常检测与修复方法,其特征在于,包括如下步骤:步骤1:采集高速公路原始多维收费数据,并对高速公路原始多维收费数据进行预处理以得到多维规范之后的原始数据;

步骤2:构建基于相似系数和的异常数据检测模型;

步骤3:将步骤1中得到的多维规范之后的原始数据输入基于相似系数和的异常数据检测模型,通过检测得到含有异常值的多维数据;

步骤4:构建基于极端梯度提升的异常数据修复模型;

步骤5:将步骤3中得到的含有异常值的多维数据输入基于极端梯度提升的异常数据修复模型,实现多维数据异常修复及效果评估。

2.如权利要求1所述的多维高速公路收费数据的异常检测与修复方法,其特征在于,对高速公路原始多维收费数据进行预处理,所述的预处理包括从高速公路原始多维收费数据中选取合适的特征因子并按照第一关系模型对其进行规范化,得到多维规范之后的原始数据;其中,第一关系模型包括:其中,x*表示已处理值,x表示待处理值,μ为待处理值的均值,σ为待处理值的标准差。

3.如权利要求1所述的多维高速公路收费数据的异常检测与修复方法,其特征在于,所述基于相似系数和的异常数据检测模型以多维规范之后的原始数据作为样本输入数据,按照第二关系模型计算数据间的相似程度,得到相似系数矩阵并据此计算出每条数据的相似系数和,通过与给定的阈值的比较结果来判别数据是否为异常数据;其中,第二关系模型包括:其中,rij表示数据xi与xj间的相似程度,Pi表示数据xi的相似系数和,x′ik表示经过规范化之后的数据xi的第k个属性值。

4.如权利要求1所述的多维高速公路收费数据的异常检测与修复方法,其特征在于,所述基于极端梯度提升的异常数据修复模型通过优化梯度提升决策树的速度和效率以实现具有较高准确度的多维数据异常修复,具体包括:将所述多维规范之后的原始数据按预设比例分为初始训练数据集和测试数据集作为样本输入数据,按照第三关系模型采用所述初始训练数据集和所述测试数据集不重叠变化更新的策略对异常数据修复模型进行训练,并采用测试数据集对应的所述多维规范之后的原始数据的属性值集作为输出数据集,重复训练,直至与上述属性值集对应的真实值满足预设训练结束条件,得到基于极端梯度提升的异常数据修复模型,其中,第三关系模型包括:

其中K代表树的总个数,fk代表第k棵树, 代表样本xi的预测结果。

5.如权利要求1所述的多维高速公路收费数据的异常检测与修复方法,其特征在于,所述的对多维数据异常修复及效果评估,其中对多维数据异常修复效果评估具体依据第四关系模型,采用均方根误差、相关系数作为算法准确度评价指标,对异常数据修复模型的修复效果进行评估;

其中,所述第四关系模型包括:

其中,R2表示复相关系数,RMSE表示均方根误差,xi为第i条数据的初始值, 为数据初始值的平均值,xp为修复后的值,n为异常值与缺失值的个数。