1.一种多无人机协作边缘计算方法,其特征在于:该方法包括以下步骤:S1:无人机相互之间建立通信链路;
S2:初始化边缘计算服务器的CPU频率周期和存储;
S3:构建任务计算服务延迟和严苛任务失败惩罚的加权和的优化模型;
S4:基于优化模型,根据车辆的位置和服务器的状况采用深度确定性策略梯度算法确定各个任务卸载的无人机;
S5:车辆将计算任务卸载到相应的无人机上;
S6:各个无人机利用二分搜索算法将计算任务划分为不同比例大小的子任务;
S7:各个无人机将子任务卸载到其他无人机上,并开始计算服务;
S8:各个无人机判断边缘计算服务器上的任务是否计算完成,若计算任务完成执行S8,否则,执行S6;
S9:基于车辆的位置和方向角采用深度确定性略梯度算法确定各个任务的交付无人机;
S10:各无人机交付任务计算结果给车辆;
所述S2中,优化步骤包括以下步骤:
S21:设所有无人机覆盖下的车辆的数目为U个,每个车辆的编号为u,每个车辆计算任务表征为S22:车辆u的将计算任务卸载到无人机n上,其任务卸载的传输延迟为:S23:无人机将任务划分为不同大小的子任务,并将各个子任务卸载给其他无人机,其任务卸载的传输延迟为S24:车辆u的各个子任务卸载到无人机n上,无人机上的边缘计算服务器计算时延为:S25:车辆u的任务的总的服务延迟为
S23:为了保证
S24:建立优化模型:
所述S5中,深度确定性策略梯度算法的状态空间为:各个车辆任务的数据量大小,即深度确定性策略梯度算法的动作空间为:对于车辆u,任务的卸载无人机与结果交付无人机,即深度确定性策略梯度算法的成本模型为:全体车辆u的任务计算服务延迟和严苛任务失败惩罚的加权和,即:所述S4中,深度确定性策略梯度算法为了得到长期的期望收益,其状态s的价值函数V为:所述S4中,深度确定性策略梯度算法包括以下步骤:S41:设置算法的迭代次数;
S42:初始化环境以及初始的状态;
S43:选择一个动作
S44:将(s
S45:评价网络和目标网络的评论家神经网络都对所述价值函数进行近似,并计算损失函数L,即:S46:通过最小化步骤S45中的损失函数L,更新评价网络中评论家神经网络的权重;
S47:根据
S48:判断是否到达迭代次数,达到则输出深度确定性策略梯度算法的网络,否则继续步骤S43-S48;
所述S6中,二分搜索算法包括以下步骤:S61:从第一个无人机开始,测量该无人机与其他无人机之间的距离,并将距离表缓存至自己的内存中,计算该无人机与其他无人机之间的距离和;
S62:从第一个无人机开始,将每个无人机收到的任务划分为等大小的两个子问题;
S63:从第一个无人机开始,将第一份子任务保存在本地的缓存区中,第二份子任务根据其他无人机的距离与距离和之比进行划分成不同大小的子问题;
S64:将不同的子问题卸载给步骤S63中相应的无人机上。
2.根据权利要求1所述的一种多无人机协作边缘计算方法,其特征在于:所述S1中,无人机携带计算服务器,且无人机的总数目为N个,每个无人机的编号为n;无人机上的边缘计算服务器上具备相同大小的中央处理器周期频率C
3.根据权利要求1所述的一种多无人机协作边缘计算方法,其特征在于:所述S4中,深度确定性策略梯度算法包含四个神经网络;其中两个网络为评价网络,在训练神经网络时更新权值;另外两个网络为目标网络,在训练神经网络时定期从评价网络中替换权值;对于评价网络与目标网络,分别采用演员神经网络与评论家神经网络对最优策略和Q值进行评价。