1.一种基于生成对抗网络实现路网交通数据修复的方法,其特征在于,所述方法包括以下步骤:
1)基于道路交通数据流进行预处理并构建交通流状态矩阵数据集;
2)基于GAE编码提取路网交通状态数据特征;
3)基于LSTM构建路网交通状态数据生成器网络;
4)基于全连接神经网络构建路网交通状态数据判别器网络;
5)基于生成对抗网络生成完整交通状态数据的特征;
6)基于GAE解码实现交通状态数据修复。
2.如权利要求1所述的基于生成对抗网络实现路网交通数据修复的方法,其特征在于,所述步骤1)的过程如下:
1.1:对数据流进行预处理,使用最大最小标准化对数据进行归一化处理,计算表达式如下:其中,xreal为道路的原始流量数据,xmin为道路原始流量数据中的最小值,xmax为道路原始流量数据中的最大值,x为预处理后的道路流量数据;
1.2:构建交通流状态数据集
获取n条路段的交通状态数据矩阵,完整的交通状态数据表达式如下:其中,交通状态数据矩阵的行向量表示同一时刻不同道路的交通状态,列向量表示同一车道不同时刻的道路交通状态的时间状态,M表示历史交通状态数据的数目,N表示输入矩阵中道路的数目,则xit表示第i条道路上的在t时刻的交通状态数据;
利用掩膜矩阵Q表示交通数据缺失状态,掩膜矩阵表达式如下:qit表示第i条道路上的在t时刻的交通状态数据是否缺失,若不缺失,则qij=1,若缺失,则qij=0,含有缺失数据的交通状态数据记为Xloss=Xtrue*Q,*表示矩阵对应元素相乘。
3.如权利要求1或2所述的基于生成对抗网络实现路网交通数据修复的方法,其特征在于,所述步骤2)的过程如下:
2.1:构建图自编码器GAE,GAE的输入是缺失交通状态数据Xloss或者完整交通状态数据Xtrue,编码输出分别是缺失交通状态数据的特征Zloss和完整交通状态数据的特征Ztrue,解码输出是新的交通状态数据矩阵 和新的邻接矩阵GAE编码器表达式如下:
其中Z为编码后的特征矩阵,WG0和WG1是编码器权重矩阵,A为邻接矩阵,D为A的度矩阵,ReLU(β)函数表达式如下:ReLU(β)=max(0,β) (6)GAE解码器表达式如下:
其中 为解码后的新的交通状态数据矩阵,WD0和WD1是解码器权重矩阵,BD0和BD1是解码T器偏置矩阵, 为解码后的新邻接矩阵,Z为Z的转置矩阵,Sigmoid(λ)激活函数表达式如下:
2.2:定义GAE模型损失函数,经过反向传播不断优化GAE模型参数,损失函数如下:l=(1+(q-1)*aij) (12)gaeloss2=norm·loss2 (16)gaeloss=gaeloss1+α·gaeloss2 (17)p为交通状态数据个数,m为车道数,aij为原邻接矩阵中第i行第j列元素, 为GAE解码得到的新邻接矩阵 中第i行第j列元素,α是超参数,gaeloss是GAE最终的损失函数;
2.3:提取道路交通数据特征
利用训练后的GAE的编码器,提取缺失道路交通状态数据的特征Zloss和完整道路交通状态数据的特征Ztrue,公式如(5)所示。
4.如权利要求1或2所述的基于生成对抗网络实现路网交通数据修复的方法,其特征在于,所述步骤3)的过程如下:定义GAN的生成器G模型结构,生成器内部结构采用LSTM神经网络,并经过全连接层获得生成器输出,生成器输入为含有缺失数据的经过GAE编码的特征Zloss,输出G(Zloss)为完整道路交通状态数据的特征;
LSTM神经网络表达式如下:
ft=σ(Wf[ht-1,xt]+bf) (18)it=σ(Wi[ht-1,xt]+bi) (19)ot=σ(Wo[ht-1,xt]+bo) (22)ht=ot*tanh(Ct) (23)其中Wf为遗忘门权重矩阵,ht-1为上一时刻输出矩阵,xt为Zloss在当前时刻t的数据输入矩阵,bf为遗忘门偏置矩阵,ft为当前时刻遗忘门输出矩阵,Wi为输入门权重矩阵,bi为输入门偏置矩阵,it为当前时刻输入门输出矩阵, 为当前时刻暂时状态矩阵,WC为当前时刻暂时状态权重矩阵,bC为当前时刻暂时状态的偏置矩阵,Ct为当前时刻的细胞单元状态矩阵,Ct-1为上一时刻的细胞单元状态矩阵,ot为当前时刻输出门矩阵,Wo为输出门权重矩阵,bo为输出门偏置矩阵,ht为当前时刻最终输出,σ为Sigmoid函数,公式如(8)所示,tanh函数表达式如下:生成器经过LSTM提取特征后,通过全连接层获取生成器的输出,生成器输出表达式如下:G(Zloss)=Sigmoid(WGht+bG) (25)其中WG是生成器全连接层权重矩阵,bG为生成器全连接层偏置矩阵,G(Zloss)即为生成器生成的完整交通状态数据的特征。
5.如权利要求1或2所述的基于生成对抗网络实现路网交通数据修复的方法,其特征在于,所述步骤4)的过程如下:定义GAN的判别器D结构,判别器使用全连接神经网络,判别器输入分别为生成器的输出G(Zloss)或者完整道路交通数据的特征Ztrue,对应判别器输出分别为D(G(Zloss))和D(Ztrue),同时定义生成器和判别器损失函数:其中n代表判别器输出的样本个数,p代表生成器输出的数据个数,Dloss为判别器损失函数,Gloss为生成器损失函数。
6.如权利要求1或2所述的基于生成对抗网络实现路网交通数据修复的方法,其特征在于,所述步骤5)的过程如下:获取经过对抗训练得到的生成器生成完整交通状态数据的特征G(Zloss)。
7.如权利要求1或2所述的基于生成对抗网络实现路网交通数据修复的方法,其特征在于,所述步骤6)的过程如下:将G(Zloss)作为GAE解码器的输入,经过GAE解码实现交通状态数据修复,解码过程如下:Xrec=Sigmoid(WD1(ReLU(WD0(G(Zloss))+BD0))+BD1) (28)将Xrec反标准化,反标准化计算表达式如下:
Xpre=Xrec(xmax-xmin)+xmin (29)Xpre即为最终修复的交通状态数据。