1.一种基于长短期记忆的行人轨迹预测方法,其特征在于:包括以下步骤:A、对所采集的数据进行预处理;
通过图像处理技术以及视频校准技术,采集某场景下行人的运动轨迹,即每个时刻行人的世界坐标(x,y);同时,记录下当前采集时刻frame id以及行人编号ped id;将上述采集到的所有行人信息,转换为1个[行人数量,4]的矩阵——第1列代表采集时刻frame id,第2列代表行人编号ped id,第3列代表行人的世界坐标中的横坐标x,第4列代表行人的世界坐标中的纵坐标y;此时要通过重采样的方法,使相邻两个采集时刻之间的间隔为0.4s;
最后,按照采集时刻frame id从小到大自上而下排列;
B、引入注意力机制;
B1、将周围其他行人相对于当前行人的位置坐标通过激活函数激活,并且嵌入参数权重,具体公式如下:其中,Φr(.)是非线性激活嵌入函数,是当前第i个行人的x坐标, 是当前第i个行人的y坐标, 是当前第i个行人周围的第j个行人的x坐标, 是当前第i个行人周围的第j个行人的y坐标,Wr是嵌入权重,B2、将当前第i个行人相对于周围第j个行人的相对位置信息经过全连接层从坐标空间进行映射,形成当前第i个行人、第j个行人的位置信息,具体公式如下:其中,FC(.)是全连接网络结构,Wfc是全连接网络参数,B3、将第i个行人、第j个行人的位置信息进行连接,形成第i个行人当前的位置信息,即注意力机制输出,具体公式如下:其中,Concat(.)是连接函数,
C、将全局行人的历史状态隐藏信息输入池化层进行池化;
C1、将当前行人坐标通过长短期记忆(LSTM)单元转化成LSTM序列信息,具体公式如下:其中,Φl(.)是Relu非线性激活函数,We是行人坐标嵌入权重, 是当前第i个行人的历史状态隐藏信息,Wh是隐藏信息嵌入权重,C2、将全局行人隐藏状态信息池化得到池化张量;
其中,PM(.)是池化函数,
C3、将隐藏状态、池化张量、注意力机制输出通过一个多层感知机MLP结构进行连接,具体公式如下:其中,MLP是多层感知机结构,Wc是嵌入权重,D、通过长短期记忆单元经过池化层后的输出,转化为长短期记忆序列信息,生成预测轨迹序列;
D1、通过LSTM单元获得当前时刻行人隐藏状态序列信息,具体公式如下:其中,Φl(.)是Relu非线性激活函数,Wl是上一时刻坐标的嵌入权重,Wd是LSTM单元的嵌入权重, 是上一时刻行人的隐藏信息,D2、将当前状态信息通过一个多层感知机结构转化到坐标空间,生成预测信息,具体公式如下:其中,MLP(.)是一个多层感知机结构,Wp是预测嵌入权重,E、训练模型;
E1、将训练集、测试集、验证集按照6:2:2的比例划分;在训练过程中用验证集不断验证模型训练效果;
E2、在t时刻预测的轨迹点坐标服从于二维正态分布,具体公式如下:E3、最小化负对数似然损失函数,具体公式如下:i
其中,L表示第i个行人的轨迹;
F、构建预测轨迹
F1、用均方误差及终点平方误差衡量预测轨迹准确度;
F2、均方误差:
F3、终点平方误差: