1.一种基于聚类和图卷积网络的路网交通状态判别方法,其特征在于,包括以下步骤:
1)选择目标路网,将其划分为n个路段;将一天24小时平均划分为k个时间段,通过传感器设备获取每个路段在每个时间段的平均流量,累计获取j天的路网交通流数据;
2)以路段为节点,以路段的平均流量为节点特征构建路网拓扑结构数据的特征矩阵,并用该特征矩阵作为路网当前时间段的交通状态的划分依据;根据路段之间是否相邻构建路网拓扑结构数据的邻接矩阵;路网拓扑结构数据由[307,1]的特征矩阵和[307,307]的邻接矩阵组成;
3)使用k‑means++算法对反映路网交通状态的特征矩阵进行聚类,从而实现对不同时间段路网交通状态等级的划分,得到具有交通状态标签的路网拓扑结构数据样本;
4)构建基于图卷积神经网络的路网交通状态判别决策模型;所述模型由GCN模块和全连接神经网络组成;首先通过GCN模块提取路网交通数据的空间特征,然后通过全连接神经网络对路网交通状态作出判别决策;该模型主要含有输入层、图卷积层、全连接层和输出层,模型的结构参数见表1;
所述GCN模块的建模包括:首先,确定输入数据和输出数据,输入数据为路网拓扑结构数据,即特征矩阵和邻接矩阵,输出数据为该路网交通状态的特征表达向量;其次构建GCN网络模型,设置网络结构参数;使用2层图卷积对路网数据特征进行提取,其具体表现形式如下:(0) (1) (2)
其中,h =X,为输入图结构数据的特征矩阵,h 为第一个GCN层的输出特征数据、h为第二个GCN层的输出特征数据; 部分是对邻接矩阵A进行标准化处理,其中(0) (1)I为单位矩阵, 为 的度矩阵;W 、W 分别表示图卷积层各层可调的权重参数;σ(·)表示ReLU非线性激活函数;
所述全连接神经网络由两个全连接层和一个输出层组成,在全连接层后增加一个Dropout操作,用于抑制网络过拟合问题,其具体表现形式如下:(2)
y1=σ(W1h +b1) (6)
y2=σ(W2y1+b2) (7)
y3=W3y2+b3 (8)
其中,y1、y2表示全连接层的输出数据,y3为模型最终的输出数据;W1、W2、W3分别表示各层可调的权重参数,b1、b2、b3分别为各层可调的偏置参数;σ(·)表示ReLU非线性激活函数;
表1 模型结构参数表
5)将步骤3)中得到的样本数据划分为训练数据集和测试数据集,用训练数据集训练步骤4)中搭建的路网交通状态判别决策模型,以测试数据集对模型路网交通状态判别的准确性进行评估。
2.如权利要求1所述的一种基于聚类和图卷积网络的路网交通状态判别方法,其特征在于:在步骤1)中,将每天按一定时间间隔划分为k个时间段,k的选取应反映出一天中路网存在的所有不同交通状态;获取j天路网交通流数据,j为365天。
3.如权利要求1所述的一种基于聚类和图卷积网络的路网交通状态判别方法,其特征在于:在步骤3)中,使用k‑means++聚类算法对路网交通状态等级进行划分,其具体步骤如下:
3.1)对样本数据作归一化处理,将样本数据归一化到区间[0,1],归一化公式如下:yi,j=(xi,j‑xi,min)/(xi,max‑xi,min) (1)式中,yi,j表示样本数据集中第i个样本数据的第j个元素归一化后的标准值;xi,j表示第i个样本数据的第j个元素的原始值;xi,max和xi,min分别表示第i个样本数据的元素的最大值和最小值;
3.2)确定聚类个数K,K表示路网交通状态划分等级级别的个数;
3.3)从样本数据集中随机选取一个样本作为初始聚类中心c1,计算每个样本数据与当前已有聚类中心之间的最短距离;接着计算每个样本被选取为下一个聚类中心的概率Pi,从而确定下一个聚类中心c2,Pi的计算公式如下:式中,Pi表示第i个样本被选为初始聚类中心的概率;xi表示第i个样本;X表示样本数据集;D(xi)表示样本数据xi与当前已有聚类中心之间的最短距离;
3.4)重复步骤3.3),直到选出K个初始聚类中心C={c1,c2,...,ck};
3.5)计算样本数据集中每个样本数据xi到K个聚类中心的距离,并将其划分到距离最小的聚类中心所对应的类中;
3.6)对于每个类别ci,重新计算该类别的聚类中心,计算公式如下:
式中,ai表示新生成的第i个类的聚类中心;ci表示第i个类的原始聚类中心;x表示聚类中心对应类中的样本数据;
3.7)重复步骤3.5)和3.6)直到聚类中心的位置不再变化。
4.如权利要求1所述的一种基于聚类和图卷积网络的路网交通状态判别方法,其特征在于:在步骤5)中,使用训练样本数据集对步骤4)中的模型进行训练,从而标定模型中的可训练参数;之后,将当前时间段路网数据输入到训练好的模型中,就能实时获得路网当前的交通状态等级。