1.一种并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,包括以下步骤:
S1、利用无人机建立辅助通信系统,所述辅助通信系统包括单个UAV以及多个与所述UAV通信的用户设备;
S2、为所述用户设备定义总问题,所述总问题的目标是最小化UAV能耗;
S3、确定所述总问题的目标函数求解所述最小化UAV能耗,所述最小化UAV能耗包括计算卸载能耗以及飞行能耗;
S4、引入选择变量bij获取所述飞行能耗中无人机并行任务悬停时间最大求解;其中所述选择变量bij为0‑1变量,表示第i个所述用户设备是否是一个在第j个位置具有最大计算卸载处理时间的用户;
S5、并根据所述选择变量bij对所述总问题进行问题转换,将其转换成NP难问题,并确定问题转换后的目标函数;随后通过块坐标下降法和DQN算法求出所有变量的最优解,从而确定UAV的最优计算频率、最优卸载位置以及最小化能耗。
2.根据权利要求1所述的并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,所述总问题的目标函数具体为:其中aij—用户设备选择决策;fij—UAV的计算频率;Tj—UAV悬停时间;ki—能量效率系数;Fi—完成任务的总CPU周期;φ—UAV能耗与悬停能耗之间的权重;pu—UAV的悬停消耗功率;i—第i个用户设备;j—表示第j个UAV位置;N—场景中用户设备数量;M—场景中UAV悬停位置。
3.根据权利要求2所述的并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,所述目标函数的约束条件为:C1:
C2: C3:
C4:
C5:
C6:
其中S—用户设备集合;Q—UAV悬停位置集合;Fc—UAV的最大计算频率;Di—任务数据大小;rij—任务上传速率;Ti—用户设备的最大任务延迟。
4.根据权利要求2所述的并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,所述选择变量的约束条件包括:C1、同一悬停位置只有一个所述用户设备的计算卸载时间是最大的,等于无人机悬停时间:
C2、无人机的悬停时间为:C3、其他所述用户设备的时间要小于等于无人机的悬停时间:
5.根据权利要求4所述的并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,在步骤S5中,所述问题转换步骤包括:S1、根据所述选择变量的约束条件以及所述总问题的目标函数,进行问题转换,得到转换后的目标函数:
S2、运用DQN算法,根据转换后目标函数的约束条件为每个所述用户设备确定一个aij以及选择变量bij;
S3、将确定好的变量带入转换后的目标函数中,使所述总问题转换为NP难问题,从而完成问题的转换。
6.根据权利要求5所述的并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,所述转换后目标函数的约束条件为:C1:
C2: C3:
C4:
C7:
C8:
C9:
7.根据权利要求3所述的并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,所述确定UAV的最优计算频率的目标函数为:其约束条件为:C3:
C4:
C8:
其中,aij、bij的值预先给定,bkj=1。
8.根据权利要求7所述的并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,在步骤S5中,求解所述UAV的最优计算频率问题可分解成M个子问题,其子问题的目标函数为:
其约束条件为:C3:
C4:
C8:
9.根据权利要求8所述的并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,确定所述UAV的最优计算频率的步骤包括:S1、给变量aij和bij赋值,确定求解最优计算频率问题的目标函数;
S2、将所述最优计算频率问题分解成M个子问题进行求解,并确定所述子问题的目标函数;
S3、结合所述子问题目标函数与其约束条件C3,将两者写成拉格朗日函数形式;随后初始化所有变量参数;
S4、利用拉格朗日对偶方法求解fkj;
S5、进一步求解得到其他所述用户设备的UAV的计算频率fij,i≠k;随后更新拉格朗日乘子
S6、判断所有变量或者拉格朗日函数是否收敛,如果收敛,则推出;否则跳回S3继续执行;其中跳回后不必重复步骤S4。
10.根据权利要求3所述的并行任务悬停时间分配的无人机最优位置的计算卸载方法,其特征在于,在步骤S5中,变量aij和bij由DQN算法求解获取,求解中确定所述最优卸载位置,具体步骤包括:
S1、为每个所述用户设备确定动作空间变量aij和bij;假设用户设备的第一动作空间变量定义为Ai∈{1,2......,M},该空间表示用户设备可以选择M个UAV位置中的一个;
S2、假设用户设备的第二动作空间定位为Bi∈{0,1},表示该用户设备是否选择成为计算卸载时间最长的用户;
S3、将两个动作空间合并:Ci∈{1,1,......,1,1,......,1,1},其中Ci[m]=1,m≤M表示用户设备i选择第m个位置卸载,并且不是最大的卸载时间;
Ci[m]=1,m>M表示用户设备i选择第m‑M个位置卸载,并且是最大的卸载时间;
S4、所述用户设备之间进行动作协调:如果用户设备i选择Ci[m]=1,m>M,则选择相同的m‑M位置卸载的用户设备的动作空间只能够是Ci[m]=1,m≤M。
S5、执行流程:
S501、根据所有用户设备,依次从动作空间选择一个动作Ai∈{1,2......,M},确定该用户设备选择哪个位置进行卸载,从而确定所述最优卸载位置;
S502、分别根据所有用户设备选择的位置,从选择结果中随机选择一个用户设备作为卸载处理任务最大时间的那个用户设备;
S503、动作空间分为两个层次,确定好动作空间后,利用凸优化理论求解连续变量;
S504、最终使算法收敛,得出变量求解结果。