1.一种顾及时空关联性的城市空气质量时序预测方法,其特征在于,包括如下步骤:S1)采集城市空间范围内所设立的空气质量监测站点的历史时段记录数据,将采集的历史时段记录数据进行数据匹配形成多特征变量在不同空气质量站点的时序记录数据;
S2)对步骤S1)采集的时序记录数据进行数据预处理,最终形成时序完整的多个空气质量监测站点的历史记录数据;
S3)将待预测站点历史时刻的气象数据输入到奇异谱分析模型中,得到待预测站点预测数据,具体步骤为:假定待预测时序特征共有k个,每类特征共包含n个时间记录,组成了大小为n*k的特征矩阵;
利用大小为l的时间窗口对时序数据进行遍历,形成多个长度为l的特征向量,组成特征矩阵Xlw,将每类特征的矩阵相嵌,叠加形成l*w*k维的特征立方体;相嵌是指将不同类别特征的特征矩阵Xlw进行叠加,组成l*w*k维特征立方体,k维指不同维度的特征;
计算每一类时序特征的特征矩阵Xlw的特征值和特征向量,即计算特征立方体的每一维剖面,并将特征值按照其重要性大小从大到小进行排序;
重构轨迹矩阵,将每一类时序特征的每一顺位特征值所对应的特征向量进行叠加,并对轨迹矩阵进行重构,形成新的特征矩阵;
通过奇异谱分析将时间序列分解为代表时间序列不同成分的特征,通过对这些重要特征分析并进一步进行预测,完成时序过程的进一步推演;
根据历史数据构建时空相关立方体,具体步骤为:
首先利用历史数据构建设定时间段内不同时刻、不同站点之间的相关矩阵,矩阵每个值代表了站点两两之间的相关性强度;
其相关性强度计算公式为:
其中,Ks代表了不同站点在某一时刻的相关性强弱,Cov()代表着变量间的协方差,S(i,t)和S(j,t)代表了i站点和j站点在t时刻所对应的空气质量记录,代表了对应变量的标准差;
时空相关立方体通过自相关系数来衡量不同时刻不同空间站点之间的相关性强弱,从而得到设定时间段中所有时刻所有空气质量监测站点之间的相关性大小并以此来构建时空相关立方体;
利用构建的时空相关立方体来提取在待预测时刻同待预测站点相关性最强的前K个邻域站点的预测数据作为辅助站点数据,包括:通过时空相关立方体在实际预测中根据所预测时段的所属时刻及位置,来确定需要引入的辅助站点优先级,需要预测某一站点在未来该时刻的空气质量指数时,从时空相关立方体当中提取出该时刻所对应的站点之间的相关性,根据邻域站点的相关性强弱对邻域站点进行排序,选择前K个重要的空间邻域站点特征;
S4)将通过时空相关立方体提取到的辅助站点数据和利用奇异谱分析模型得到的待预测站点预测数据进行耦合,共同组成输入特征集,将输入特征集放入随机森林模型之中,由随机森林模型预测得到待预测站点在待预测时刻的最终的预测结果;
针对前K个重要的空间邻域站点特征,按照其重要性次序逐一添加进入随机森林算法进行训练;按照模型精度来选择最佳的特征个数K。
2.根据权利要求1所述的顾及时空关联性的城市空气质量时序预测方法,其特征在于:步骤S1)中的数据匹配是指将由空气质量监测站点所采集到的数据按照采集时间、采集站点、所属类别进行匹配,规范数据,得到的数据为各站点在不同时刻的气象监测数据。
3.根据权利要求1所述的顾及时空关联性的城市空气质量时序预测方法,其特征在于:采集的城市空间范围内所设立的空气质量监测站点的历史时段记录数据包括PM2.5监测数据和气象特征数据。
4.根据权利要求1所述的顾及时空关联性的城市空气质量时序预测方法,其特征在于:数据预处理包括异常值筛选、剔除、插值以及缺失值填补。
5.根据权利要求4所述的顾及时空关联性的城市空气质量时序预测方法,其特征在于:插值方法选择IDW反距离权重插值,通过插值获取在对应时刻空气质量监测站点位置的相应气象信息。
6.根据权利要求4所述的顾及时空关联性的城市空气质量时序预测方法,其特征在于:缺失值填补是利用随机森林算法对同一时刻的气象特征和PM2.5指数之间的相关性进行建模,根据气象特征同PM2.5数值之间的相关性模型,实现气象特征和PM2.5值之间的相互推测。