欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2024107442177
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-12-16
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于稀疏时空图Transformer网络的行人轨迹预测方法,其特征在于,包括以下步骤:S1:从图像帧中获取行人的位置信息,对行人轨迹信息进行数据预处理,得到当前帧每个行人的轨迹坐标,通过遍历图像帧,获取行人所有帧对应的轨迹;

S2:使用动态空间Transformer,利用自注意力机制对空间依赖关系进行动态建模,利用多头注意力机制对空间依赖的多种模式进行联合建模;

S3:使用时间Transformer,利用自注意力机制实现跨多个时间步的双向时间依赖性建模;

S4:使用稀疏映射函数entmax15应用于空间和时间Transformer,得到具有稀疏变换的时空Transformer网络;

S5:设计一种基于时空Transformer的时空块链的模型框架,同时利用动态空间依赖性和长期的时间依赖性;

所述步骤S5具体为:观测轨迹首先通过全连接层得到输入特征,接着进入到稀疏空间Transformer和稀疏时间Transformer,第l个时空块的输入是由第l-1个时空块在时间步长Tobs-k+1的输出,稀疏空间Transformer和稀疏时间Transformer被堆叠来生成输出张量,同时利用残差连接,以实现稳定的训练,稀疏空间Transformer从输入中提取空间特征;

和进行融合得到作为后续稀疏时间Transformer的输入,最终生成一个新的张量获得输出张量并将该张量作为第l+1个时空块的输入;

S6:利用全连接层对行人运动的状态信息生成行人未来的轨迹位置。

2.根据权利要求1所述的基于稀疏时空图Transformer网络的行人轨迹预测方法,其特征在于,所述步骤S2中,具体包括以下步骤:S2.1:动态图卷积层

空间嵌入特征通过学习一个线性映射,将每个节点的输入特征投影到一个高维潜在子空间中,在高维潜在子空间中通过训练和建模来捕获动态的空间依赖性,首先将稀疏空间Transformer的输入特征Xs经过空间嵌入后得到空间嵌入特征再将每个时间步的嵌入特征投影到高维潜在子空间中,投影映射是由多个全连接层组成的前馈神经网络实现的,对于每一种空间依赖模式,为每个节点在每个时间步的嵌入特征训练三个潜在子空间,包括查询子空间Qs,键子空间Ks和值子空间Vs;

其中,分别是Qs,Ks,Vs的权重矩阵;

利用Qs和Ks的点积计算节点间的动态空间依赖Ss:

使用稀疏注意力函数1.5-entmax归一化空间依赖,用Ss更新节点特征,得到节点的新特征为As,新特征节点经过前馈神经网络并在学习As的前提下提高预测:As(Qs,Ks,Vs)=SsVs

S2.2:提取行人之间的交互

采用自注意力机制用于图上的消息传递,使用多头注意力函数MultiheadAttention计算节点之间的注意力权重,多头注意力设置为8头,通过学习多个线性映射,以在不同的潜在子空间中模拟受各种因素影响的动态空间依赖性。

3.根据权利要求1所述的基于稀疏时空图Transformer网络的行人轨迹预测方法,其特征在于,所述步骤S3具体为:S3.1:自注意力首先计算从时间t=1到T的查询矩阵Qt、键矩阵Kt和对应的值矩阵Vt;

其中的查询、键和值函数为一个共享的线性变换函数,利用Qt和Kt的点积计算节点间的双向时间依赖性,使用稀疏注意力函数entmax15归一化时间依赖,用St更新节点特征,得到节点的新特征为At;

At(Qt,Kt,Vt)=StVt。

4.根据权利要求1所述的基于稀疏时空图Transformer网络的行人轨迹预测方法,其特征在于,所述步骤S4具体为:采用泛化的注意力机制α-entmax转换,通过引入一个可调整的参数α,允许模型在softmax和sparsemax之间平滑过渡,设置参数α=1.5。