欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020109955687
申请人: 西安理工大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-05-07
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于谱聚类的非均衡交通事故严重程度分析方法,其特征在于,具体按照以下步骤实施:步骤1、通过路段摄像头或者检测器记录车辆在运行过程中发生车祸时的原始事故数据D';

步骤2、通过编码技术将原始事故数据D'进行离散编码及归一化,得到有效事故数据D;

所述步骤2具体如下:

步骤2.1、设原始事故数据D'={x',y'},

其中,x'代表整个环境因素样本,q=1,...,n表示环境因素,n表示影响因素总数,p=

1,...,m表示发生的事故,m为记录的事故总数,x'p,q表示发生第p起事故时周围的环境因素q;y'代表整个事故严重程度样本,y'p表示第p起事故的严重程度;

步骤2.2、通过离散编码,将每个环境因素以及事故严重程度所对应的结果映射为一个数字,设天气因素中:雨天=1,晴天=2,刮风=3,雪天=4,大雾=5,霜冻=6,其他=7;路面因素中:干燥=1,潮湿=2,结冰=3,淤泥=4,融雪=5,积水=6,其他=7;事故严重程度:轻微事故=1,一般事故=2,重大事故=3,特大事故=4,将所有环境因素x'与事故严重程度y'离散化,得到离散型事故数据x'n、y',x'n表示事故严重程度所对应的n个环境因素,y'表示离散后的事故严重程度;

步骤2.3、通过步骤2.2得到离散型事故数据x'n,利用最大最小归一化方法,对离散型事故数据x'n进行归一化,如公式(1)所示:其中,x'n表示事故严重程度所对应的n个环境因素,xn是归一化后的环境因素,n表示环境因素个数;

因此得到有效事故数据D={x,y},

其中,x代表有效数据D中整个环境因素样本,xp,q表示有效数据D中发生第p起事故时周围的环境因素q;y代表有效数据D中整个事故严重程度样本,yp表示有效数据D中第p起事故的严重程度;q=1,...,n表示环境因素,n表示影响因素总数,p=1,...,m表示发生的事故,m为记录的事故总数;

步骤3、结合合成少数类过采样技术SMOTE算法将有效事故数据D进行重采样,得到先验分布均衡的事故数据T;

所述步骤3具体如下:

步骤3.1、确定有效事故数据D中的少类事故严重程度样本ys,s=1,2,...,N,N为少类事故严重程度样本总数;每个ys对应有n个环境因素,事故严重程度ys所对应的第q个环境因素为ys,q,q=1,2,...,n;确定有效事故数据D中的多类事故严重程度样本yg,g=1,2,...,M,M为多类事故严重程度样本总数,事故严重程度yg所对应的第q个环境因素为yg,q;

h

步骤3.2、统计少类事故严重程度样本ys周围的h个同类样本点,h=1,...,5,计算ys与hys之间相对应第q个环境因素的差值diffq=ys,q‑ys,q,然后利用公式(2)计算新生成的环境因素fs,q,其中,α是范围在[0,1]内的随机值,fs,q是所产生的新的少类样本,s=1,2,...,N为少类事故严重程度样本,N为少类事故严重程度样本总数,ys,q,q=1,2,...,n事故严重程度ysh所对应的第q个环境因素,ys,q为少类事故严重程度样本ys,q周围的第h个同类样本点所对应的第q个环境因素,q=1,...,n表示环境因素;

通过上述过程计算少类样本ys对应的不同环境因素值fs,q=[fs,1,...,fs,n],从而得到新的少类样本ys,其对应的环境因素为fs,q,将其融入至有效事故数据D中,D的少类样本数目增大,使得事故数据分布均衡,得到先验分布均衡的事故数据T={X,Y},其中,其中,X代表先验分布均衡的事故数据T中整个环境因素样本,Xp',q表示先验分布均衡的事故数据T中发生第p'起事故时周围的环境因素q;Y代表先验分布均衡的事故数据T中整个事故严重程度样本,Yp表示先验分布均衡的事故数据T中第p'起事故的严重程度;q=

1,...,n表示环境因素,n表示影响因素总数,p'=1,...,M表示发生的事故,M为先验分布均衡的事故数据T中的事故总数,M=m+l,m为原始长度,l是通过重采样生成的新样本数;

步骤4、将结构化事故数据T转化为事故图数据G;

所述步骤4具体如下:

步骤4.1、通过步骤3得到先验分布均衡的事故数据T={X,Y},为了构建事故图数据G=(V,E),其中,V表示事故数据中的不同的事故严重程度Yp'所对应的环境因素集合,简称为事故集合,E表示事故集合中各节点相连接的边的集合,V=(X1,...,Xi,...,XM),i=1,2,...,M,M为先验分布均衡的事故数据T中的事故总数,也为事故集合节点Xi的总数;通过计算事故数据T中事故集合里不同节点Xi之间的权重值来判断节点Xi之间是否相连,构建边集合E,也称为邻接矩阵W;

步骤4.2、利用全连接法计算各个节点之间的权重wij,并选择高斯核函数作为核函数定义权重wij,其中wij表示事故集合里节点Xi与节点Xj之间的权重,其中Xi代表事故严重程度样本Yi所对应的所有影响因素,Xj代表事故严重程度样本Yj所对应的所有影响因素,由于每两个节点之间无方向之分,因此wij=wji,具体计算过程如公式(3)所示:得到大小为M×M的邻接矩阵

其中, M为事故集合节点Xi的总数;

因此,通过构建邻接矩阵W得到边集合E,将先验分布均衡的事故数据T={X,Y}转化为事故图数据G=(V,E);

步骤5、结合谱聚类算法,得到不同环境因素对应的事故严重程度,

所述步骤5具体如下:

步骤5.1、通过步骤4得到各个事故集合节点之间的权重wij,通过计算与每个事故集合节点Xi相连的所有节点的权重之和di,计算公式如公式(4)所示:其中,M表示事故集合节点Xi的总数,进而得到M×M的度矩阵 D为

对角矩阵;

步骤5.2、通过步骤4得到的邻接矩阵和步骤5.1得到的事故图数据G的度矩阵,而拉普拉斯矩阵L是由度矩阵与邻接矩阵之差得到,如公式(5)所示:L=D‑W          (5)

然后构建标准化拉普拉斯矩阵Lsym,如公式(6)所示:

sym ‑1/2 ‑1/2 ‑1/2 ‑1/2

L =D LD =I‑D WD    (6)

再计算标准化拉普拉斯矩阵Lsym的k个特征值及特征值对应的特征向量fk,且k<M,将不同特征值对应的特征向量fk组成矩阵 其中,fk=[f'1,k,...,T

f'i,k,...,f'M,k] ,表示一组特征向量,再对其进行行标准化,得到大小为M×k的特征矩阵通过转置特征矩阵F,得到新的矩阵步骤5.3、事故严重程度分为C个等级,C={C1,C2,C3,C4},因此,需要聚为C类,通过K近邻算法在新的矩阵Q选择C个初始聚类中心,通过计算每个聚类中心与周围节点之间的距离划分类别,依据为不同的聚类中心与其周围的节点距离最小,与其他聚类中心周围的节点距离最大,则说明聚类成功,最终将事故图数据G中事故严重程度所对应的不同环境因素数据聚为C类,每一类代表一个事故严重程度,即将矩阵Q中不同的向量按照距离划分为C个不同的事故严重程度等级,若某一类别数量较大,则需要通过分析该类别所对应的环境因素,改善交通运行条件。