欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 202010110743X
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-12-18
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于长短期记忆的行人轨迹预测方法,其特征在于:包括以下步骤:A、对所采集的数据进行预处理;

通过图像处理技术以及视频校准技术,采集某场景下行人的运动轨迹,即每个时刻行人的世界坐标(x,y);同时,记录下当前采集时刻frame id以及行人编号ped id;将上述采集到的所有行人信息,转换为1个[行人数量,4]的矩阵——第1列代表采集时刻frame id,第2列代表行人编号ped id,第3列代表行人的世界坐标中的横坐标x,第4列代表行人的世界坐标中的纵坐标y;此时要通过重采样的方法,使相邻两个采集时刻之间的间隔为0.4s;

最后,按照采集时刻frame id从小到大自上而下排列;

B、引入注意力机制;

B1、将周围其他行人相对于当前行人的位置坐标通过激活函数激活,并且嵌入参数权重,具体公式如下:其中,Φr(.)是非线性激活嵌入函数,是当前第i个行人的x坐标, 是当前第i个行人的y坐标, 是当前第i个行人周围的第j个行人的x坐标, 是当前第i个行人周围的第j个行人的y坐标,Wr是嵌入权重,B2、将当前第i个行人相对于周围第j个行人的相对位置信息经过全连接层从坐标空间进行映射,形成当前第i个行人、第j个行人的位置信息,具体公式如下:其中,FC(.)是全连接网络结构,Wfc是全连接网络参数,B3、将第i个行人、第j个行人的位置信息进行连接,形成第i个行人当前的位置信息,即注意力机制输出,具体公式如下:其中,Concat(.)是连接函数,

C、将全局行人的历史状态隐藏信息输入池化层进行池化;

C1、将当前行人坐标通过长短期记忆(LSTM)单元转化成LSTM序列信息,具体公式如下:其中,Φl(.)是Relu非线性激活函数,We是行人坐标嵌入权重, 是当前第i个行人的历史状态隐藏信息,Wh是隐藏信息嵌入权重,C2、将全局行人隐藏状态信息池化得到池化张量;

其中,PM(.)是池化函数,

C3、将隐藏状态、池化张量、注意力机制输出通过一个多层感知机MLP结构进行连接,具体公式如下:其中,MLP是多层感知机结构,Wc是嵌入权重,D、通过长短期记忆单元经过池化层后的输出,转化为长短期记忆序列信息,生成预测轨迹序列;

D1、通过LSTM单元获得当前时刻行人隐藏状态序列信息,具体公式如下:其中,Φl(.)是Relu非线性激活函数,Wl是上一时刻坐标的嵌入权重,Wd是LSTM单元的嵌入权重, 是上一时刻行人的隐藏信息,D2、将当前状态信息通过一个多层感知机结构转化到坐标空间,生成预测信息,具体公式如下:其中,MLP(.)是一个多层感知机结构,Wp是预测嵌入权重,E、训练模型;

E1、将训练集、测试集、验证集按照6:2:2的比例划分;在训练过程中用验证集不断验证模型训练效果;

E2、在t时刻预测的轨迹点坐标服从于二维正态分布,具体公式如下:E3、最小化负对数似然损失函数,具体公式如下:i

其中,L表示第i个行人的轨迹;

F、构建预测轨迹

F1、用均方误差及终点平方误差衡量预测轨迹准确度;

F2、均方误差:

F3、终点平方误差: