1.一种机动车用的碳排放监测方法,包括:采集机动车的行使数据集,行使数据集包含车速、油耗和里程;
对采集的行使数据集进行包含异常值检测和平滑处理的预处理;
利用预处理后的行使数据集,训练长短期记忆网络,得到碳排放预测模型A;
利用预处理后的行使数据集,训练梯度提升树,得到碳排放预测模型B;
根据得到的碳排放预测模型A和碳排放预测模型B,通过权重系数,得到融合的碳排放预测模型C;
利用碳排放预测模型C,对机动车碳排放进行预测;
对采集的行使数据集进行包含异常值检测和平滑处理的预处理,包括:采用局部外推算法,将采集的油耗和里程作为输入,检测其中的异常值,并标记异常值的油耗和里程;
将采用移动平均算法,对采集的车速进行平滑处理;
将平滑后的车速、标记异常值的油耗和里程,作为输入,采用线性插值算法,对异常值进行填补,作为预处理后的行使数据集;
采用基于KNN的局部外推算法;
采用局部外推算法,标记异常值的油耗和里程包括如下步骤:基于获取的机动车行驶数据,计算每个数据样本与其他数据样本之间的距离;
选择与目标数据样本距离最近的K个数据样本作为相应的近邻;
根据K个近邻数据样本,构建局部线性回归模型,作为KNN局部模型;
将新采集的机动车行驶数据输入至KNN局部模型,通过KNN局部模型计算新采集的机动车行驶数据的预测值;
计算预测值与新采集的机动车行驶数据的实际值之间的偏差;
将偏差与预设阈值进行比较,当偏差超过预设阈值时,将新采集的机动车行驶数据判定为异常值,并标记异常值对应的油耗数据和里程数据;
将采用移动平均算法,对采集的车速进行平滑处理包括如下步骤:获取机动车行驶过程中采集的车速时间序列数据,车速时间序列数据包含按时间顺序排列的多个车速数据点;
设定时间窗口参数w,时间窗口参数w表示参与平均速度计算的车速数据点的数量;其中,时间窗口参数w的取值为5;
对于车速时间序列数据中的每个目标车速数据点,确定对应数据点前后各w个车速数据点,构成一个局部车速数据段;
计算局部车速数据段内所有车速数据点的平均值,作为目标车速数据点的平滑速度值;
将车速时间序列数据中所有车速数据点的原始速度值替换为对应的平滑速度值,得到平滑处理后的车速时间序列数据;
根据采集的油耗和里程,构建KD树;
采用启发式遍历算法,遍历构建的KD树,获取与目标节点的相关性大于阈值的若干个叶子节点集合;
采用遗传算法,将获取的叶子节点集合作为训练集,获取KNN算法中的最优参数K值;
将获得的叶子节点集合和最优参数K值,作为输入,采用KNN算法,计算叶子节点与目标节点的距离,获得目标节点的K个最近邻叶子节点;
计算目标节点与每个最近邻叶子节点的相关性,获得K个相关性值;
将每个相关性值与预设的相关性阈值进行比较,统计大于等于相关性阈值的数量;
如果大于等于相关性阈值的数量在K个近邻节点中所占的比例低于预设值,则判断目标节点为异常值;
采用遗传算法,将获取的叶子节点集合作为训练集,获取KNN算法中的最优参数K值,包括如下步骤:将候选叶子节点集合作为KNN算法的训练样本,将不同的K值作为遗传算法的染色体编码,定义KNN分类准确率为染色体适应度函数;
通过遗传算法的选择、交叉和变异操作,迭代搜索最优K值。
2.根据权利要求1所述的机动车用的碳排放监测方法,其特征在于:线性插值算法中采用的相关性计算方法采用皮尔森相关系数。
3.根据权利要求1或2所述的机动车用的碳排放监测方法,其特征在于:采用spark进行分布式预处理。
4.根据权利要求3所述的机动车用的碳排放监测方法,其特征在于:训练长短期记忆网络时,采用含动量项Momentum的梯度下降法调整网络权重w:;
其中,为学习率,为损失函数L关于权重的梯度,为动量因子,为上一步权重更新量。
5.根据权利要求4所述的机动车用的碳排放监测方法,其特征在于:梯度提升决策树由多棵CART决策树作为基学习器构成。
6.根据权利要求5所述的机动车用的碳排放监测方法,其特征在于:构建所述CART决策树时,采用Gini系数作为分裂特征的选择条件。