1.基于无人机群的最大传感器数据采集路径规划方法,其特征在于,包括:获取地面环境信息,采用六边形区域搜索算法判断无人机群各自位置是否有相邻者,生成位置关系矩阵;
根据位置关系矩阵和相邻无人机的个数,计算所有无人机的总覆盖区域面积;
将局部观测数据和位置关系矩阵输入DQN网络进行训练,基于总覆盖区域面积和实时位置的改变,采用奖励函数调整无人机的路径,最终得到能采集到最大传感器数据的路径规划;
所述采用六边形区域搜索算法判断无人机群各自位置是否有相邻者,生成位置关系矩阵,以及基于总覆盖区域面积和实时位置的改变,采用奖励函数调整无人机的路径的具体过程包括:步骤1:将整体区域离散化,划分为六边形离散区域,在六边形网格坐标系中,在偏移坐标中使用偏移偶数列;
步骤2:将无人机进行编号,初始化无人机群的位置和地面传感器采集到地面信息,更新缓存器;
步骤3:无人机在当前的位置通过无线传输与地面传感器进行连接获取局部观测数据;
步骤4:使用六边形区域搜索算法判断相邻的无人机的个数,选中编号最大和编号次大的无人机,根据 判断两个无人机是否相邻,若相邻,将标志位变1,否则,标志位变0;
步骤5:重复步骤4,直至所有的无人机判断结束,获得位置矩阵和相邻无人机的个数cnt并计算出所有无人机的覆盖区域面积;
步骤6:将局部观测数据和位置矩阵一起作为DQN算法网络的状态输入;
步骤7:无人机的移动方向根据六边形的特性设置为六个方向,对于每个无人机,根据当前的状态输入,并根据贪婪策略选择概率较大的动作并执行;
步骤8:通过所述奖励函数,得到相应的回报,同时获得新的状态输入;所述奖励函数为:其中, 表示正六边形面积的六
分之一; 表示无人机覆盖区域面积的六分之一;cnt表示无人机群覆盖区域有重叠的无人机个数;
步骤9:将原状态输入、执行的动作、获得的回报、新的状态一起发送到地面基站并存储,DQN网络在地面基站被训练;
步骤10:从地面基站的存储器中随机抽取训练样本,通过损失函数来训练网络参数;
步骤11:不断重复步骤3、4、5、6、7、8,直至训练完成,数据收敛。
2.基于无人机群的最大传感器数据采集路径规划方法,包括分布在给定固定区域内收集周围地面环境信息的多个传感器、获取传感器采集信息的无人机群和接收无人机发送数据的地面基站,其特征在于,获取传感器采集的地面环境信息,采用六边形区域搜索算法判断无人机群各自位置是否有相邻者,生成位置关系矩阵;
根据位置关系矩阵和相邻无人机的个数,计算所有无人机的总覆盖区域面积;
地面基站获取局部观测数据和位置关系矩阵,将局部观测数据和位置关系矩阵输入DQN网络进行训练,基于总覆盖区域面积和无人机群实时位置的改变,采用奖励函数调整无人机的路径,最终得到能采集到最大传感器数据的路径规划;
所述采用六边形区域搜索算法判断无人机群各自位置是否有相邻者,生成位置关系矩阵,以及基于总覆盖区域面积和实时位置的改变,采用奖励函数调整无人机的路径的具体过程包括:步骤1:将整体区域离散化,划分为六边形离散区域,在六边形网格坐标系中,在偏移坐标中使用偏移偶数列;
步骤2:将无人机进行编号,初始化无人机群的位置和地面传感器采集到地面信息,更新缓存器;
步骤3:无人机在当前的位置通过无线传输与地面传感器进行连接获取局部观测数据;
步骤4:使用六边形区域搜索算法判断相邻的无人机的个数,选中编号最大和编号次大的无人机,根据 判断两个无人机是否相邻,若相邻,将标志位变1,否则,标志位变0;
步骤5:重复步骤4,直至所有的无人机判断结束,获得位置矩阵和相邻无人机的个数cnt并计算出所有无人机的覆盖区域面积;
步骤6:将局部观测数据和位置矩阵一起作为DQN算法网络的状态输入;
步骤7:无人机的移动方向根据六边形的特性设置为六个方向,对于每个无人机,根据当前的状态输入,并根据贪婪策略选择概率较大的动作并执行;
步骤8:通过 得到相应的回报,同
时获得新的状态输入;
其中, 表示正六边形面积的六
分之一; 表示无人机覆盖区域面积的六分之一;cnt表示无人机群覆盖区域有重叠的无人机个数;
步骤9:将原状态输入、执行的动作、获得的回报、新的状态一起发送到地面基站并存储,DQN网络在地面基站被训练;
步骤10:从地面基站的存储器中随机抽取训练样本,通过损失函数来训练网络参数;
步骤11:不断重复步骤3、4、5、6、7、8,直至训练完成,数据收敛。
3.根据权利要求2所述的基于无人机群的最大传感器数据采集路径规划方法,其特征在于,在获取传感器采集的地面环境信息之前,包括:初始化传感器缓存的数据、无人机缓存的数据以及地面基站存储的数据。
4.基于无人机群的最大传感器数据采集路径规划系统,其特征在于,包括:矩阵生成模块,其被配置为:获取地面环境信息,采用六边形区域搜索算法判断无人机群各自位置是否有相邻者,生成位置关系矩阵;
总覆盖区域面积计算模块,其被配置为:根据位置关系矩阵和相邻无人机的个数,计算所有无人机的总覆盖区域面积;
路径规划模块,其被配置为:将局部观测数据和位置关系矩阵输入DQN网络进行训练,基于总覆盖区域面积和实时位置的改变,采用奖励函数调整无人机的路径,最终得到能采集到最大传感器数据的路径规划;
所述采用六边形区域搜索算法判断无人机群各自位置是否有相邻者,生成位置关系矩阵,以及基于总覆盖区域面积和实时位置的改变,采用奖励函数调整无人机的路径的具体过程包括:步骤1:将整体区域离散化,划分为六边形离散区域,在六边形网格坐标系中,在偏移坐标中使用偏移偶数列;
步骤2:将无人机进行编号,初始化无人机群的位置和地面传感器采集到地面信息,更新缓存器;
步骤3:无人机在当前的位置通过无线传输与地面传感器进行连接获取局部观测数据;
步骤4:使用六边形区域搜索算法判断相邻的无人机的个数,选中编号最大和编号次大的无人机,根据 判断两个无人机是否相邻,若相邻,将标志位变1,否则,标志位变0;
步骤5:重复步骤4,直至所有的无人机判断结束,获得位置矩阵和相邻无人机的个数cnt并计算出所有无人机的覆盖区域面积;
步骤6:将局部观测数据和位置矩阵一起作为DQN算法网络的状态输入;
步骤7:无人机的移动方向根据六边形的特性设置为六个方向,对于每个无人机,根据当前的状态输入,并根据贪婪策略选择概率较大的动作并执行;
步骤8:通过 得到相应的回报,同
时获得新的状态输入;
其中, 表示正六边形面积的六
分之一; 表示无人机覆盖区域面积的六分之一;cnt表示无人机群覆盖区域有重叠的无人机个数;
步骤9:将原状态输入、执行的动作、获得的回报、新的状态一起发送到地面基站并存储,DQN网络在地面基站被训练;
步骤10:从地面基站的存储器中随机抽取训练样本,通过损失函数来训练网络参数;
步骤11:不断重复步骤3、4、5、6、7、8,直至训练完成,数据收敛。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1所述的基于无人机群的最大传感器数据采集路径规划方法中的步骤。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1所述的基于无人机群的最大传感器数据采集路径规划方法中的步骤。