1.一种人车交互场景下行人与车辆的轨迹预测方法,其特征在于:包括以下步骤:A、对所采集的数据进行预处理;
B、人工生成足够完全复现车辆形状的数据点;
B1、将行人横、纵坐标记为 具体公式如下:
B2、将车辆前左轮、前右轮、后左轮、后右轮的横、纵坐标分别记为 具体公式如下:其中,fl表示front left,fr表示front right,rl表示rear left,rr表示rear right;
B3、计算车辆长度,并把行人长度记为LP,具体公式如下;
B4、计算车长单位向量,具体公式如下;
左边车长单位向量: ( 为单位向量);
右边车长单位向量: ( 为单位向量);
B5、获得总间隔数,具体公式如下:
B6、获得车长上所有点的向量,此处采用”pythonic”(python风格化)的流程,具体公式如下:for n in range(1,interval):B7、根据相似三角形,可得全部数据点坐标,并将全部坐标连接记为 具体公式如下:其中, 表示左边车长上除前左轮和后左轮的所有点坐标, 表示右边车长上除前右轮和后右轮的所有点坐标,n∈[1,interval-1];
C、将行人及车辆位置坐标通过激活函数激活,并且嵌入参数权重,具体公式如下:其中, 为行人横、纵坐标, 为车辆四个顶点及车边长上所有数据点的横、纵坐标集合,Wep为行人坐标嵌入权重,Wev为车辆坐标嵌入权重,Φ(.)是非线性激活函数;
D、池化层结构;
D1、将目标周围网格化,判断当前状态属于车辆在行人所属网格里,行人在行人所属网格里,行人在车辆所属网格里还是车辆在车辆所属网格里,具体公式如下:其中, 代表车辆在行人所属网格里, 代表行人在行人所属网格里, 代表行人在车辆所属网格里, 代表车辆在车辆所属网格里, 代表上一时刻行人的隐藏状态, 代表上一时刻车辆的隐藏状态;
D2、激活池化网图,具体公式如下:
其中,Wpv、Wpp、Wvp、Wvv分别为嵌入权重,Φ(.)是非线性激活函数;
E、通过长短期记忆单元经过池化层后的输出,转化为长短期记忆序列信息,生成预测轨迹序列;
E1、激活上一时刻行人及车辆的坐标,具体公式如下:
其中, 表示上一时刻行人的坐标被激活后的输出量, 表示上一时刻车辆的坐标被激活后的输出量,Wlp、Wlv分别为嵌入权重;
E2、通过LSTM单元获得当前时刻行人及车辆的隐藏状态序列信息,具体公式如下:其中, 表示上一时刻行人的隐藏信息, 表示上一时刻车辆的隐藏信息,Wlstm-p、Wlstm-v分别为嵌入权重;
E3、将当前状态信息通过一个多层感知机结构转化到坐标空间,生成预测信息,具体公式如下:其中,n∈[1,interval-1],Wpred-p、Wpred-v分别为嵌入权重;
F、训练模型:
F1、将训练集、测试集、验证集按照6∶2∶2的比例划分。在训练过程中每隔10个轮次(epochs)就用验证集验证模型训练效果;
F2、在t时刻行人及车辆轨迹点坐标服从于二维正态分布,具体公式如下:F3、训练过程中不断减小负对数似然损失函数,具体公式如下:i j
其中,L表示第i个行人的轨迹,L表示第j辆车辆的轨迹;
G、用平均偏移误差(ADE)及最终偏移误差(FDE)衡量预测轨迹准确度,具体公式如下;
行人:
车辆:
其中,*∈[fl,(ln),rl,fr,(rn),rr],n∈[1,interval-1]。
2.根据权利要求1所述的人车交互场景下行人与车辆的轨迹预测方法,其特征在于,所述的预处理包括:通过图像处理技术以及视频校准技术,主要采集某场景下右转车辆与斑马线上行人的运动轨迹,此处需要采集行人的(x,y)坐标以及车辆的前左轮、前右轮、后左轮、后右轮的(x,y)坐标;
对于行人来说,记录下当前采集时刻frame id以及行人编号ped id;将采集到的所有行人信息,转换为1个[行人数量,4]的矩阵——第1列代表采集时刻frame id,第2列代表行人编号pedid,第3列代表行人的横坐标x,第4列代表行人的纵坐标y;此时要通过重采样的方法,使相邻两个采集时刻之间的间隔为0.4s(即2.5Fps);最后,按照采集时刻frame id从小到大自上而下排列;
对于车辆来说,记录下当前采集时刻frame id以及车辆编号veh id;将采集到的所有车辆信息,转换为1个[车辆数量,10]的矩阵——第1列代表采集时刻frame id,第2列代表车辆编号veh id,第3列代表车辆前左轮的横坐标fl_x(fl表示front left),第4列代表车辆前左轮的纵坐标fl_y(fl表示front left),第5列代表车辆前右轮的横坐标fr_x(fr表示front right),第6列代表车辆前右轮的纵坐标fr_y(fr表示front right),第7列代表车辆后左轮的横坐标rl_x(rl表示rear left),第8列代表车辆后左轮的纵坐标rl_y(rl表示rear left),第9列代表车辆后右轮的横坐标rr_x(rr表示rear right),第10列代表车辆后右轮的纵坐标rr_y(rr表示rear right);此时要通过重采样的方法,使相邻两个采集时刻之间的间隔0.4s(即2.5Fps);最后,按照采集时刻frame id从小到大自上而下排列。