欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2023100656132
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:授权未缴费
专利领域: 电通信技术
更新日期:2025-06-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种无人机协作NOMA通信网络的能效最大化方法,其特征在于,包括以下步骤:步骤1)、在存在硬件损伤的条件下建立一个无人机协作NOMA通信网络能效最大化模型;

步骤2)、迭代优化对能效最大化模型进行求解,初始化无人机起点、终点位置以及其发射功率、解码顺序变量、基站位置以及发射功率、用户最小速率门限、基站功率分配系数、飞行周期大小;

步骤3)、设置深度Q学习算法中环境的参数,将状态空间定义为{无人机的水平坐标、系统能效}、将动作空间定义{基站发射功率、无人机发射功率、无人机飞行方向、无人机飞行速度}、将奖励定义{系统能效},其中无人机充当智能体;

步骤4)、根据无人机的初始位置以及其功率、基站发射功率求解出解码顺序以及功率分配系数,并判断功率分配系数是否收敛,若已收敛则更新功率分配系数,否则重复该步骤直至结果收敛;

步骤5)、输入无人机当前时刻的水平位置坐标、解码顺序、飞行方向以及速度、基站发射功率、步骤4)收敛后的功率分配系数至深度神经网络,并对深度Q学习算法中的Q值进行更新;

步骤6)、深度神经网络通过对样本的学习,输出当前时刻从环境中获得的奖励,并改变智能体状态到下一刻并更新基站发射功率,同时将学习后的样本存储在经验回放池中,对输出参数进行保存;

步骤7)、判断无人机飞行周期是否结束,若未结束则转至步骤4),若已结束则先判断无人机飞行周期的平均奖励是否已经收敛,若已经收敛,则将步骤6)记录的每个时刻的无人机位置进行轨迹绘制,同时输出每个时隙无人机的功率以及飞行速度、基站发射功率,若未收敛则转至步骤2)直至收敛。

2.根据权利要求1所述的一种无人机协作NOMA通信网络的能效最大化方法,其特征在于,所述步骤1)建立UAV协作NOMA通信网络能效最大化模型为:(P1)

s.t.

C1a:

C1b:

C1c:

C1d:

C1e:0≤αm≤1

C1f:

C1g:

C1h:

C1i:

C1j:

C1k:

C1l:quav[1]=q0

C1m:quav[N]=qF

该优化问题的优化变量为Pbs基站发射功率、Puav无人机发射功率、quav无人机的位置、V表示无人机的飞行速度、α表示功率分配系数向量;所考虑系统包括M个用户,且无人机飞行周期为N,无人机的最大飞行速度为Vmax,用t表示单独每一时刻,ηEE表示当前时刻t的系统能效, 和 分别表示基站和无人机的最大发射功率,αm、ak分别表示用户m、k的功率分配系数,Auav表示无人机的飞行高度, 表示在t时刻从基站到无人机的信道功率增益,表示在t时刻从无人机到用户m的信道功率增益,φk,m是二元解码变量,表示在用户k端去解码用户m信号,同样的,φm,k和φm,m分别表示在用户m端去解码用户k的信号以及用户m解码自身的信号,其取值为0或1,其取值为1时表示用户m在解码自身信号时候需要将用户k的信号视为干扰,若为0时则表示用户m在解码自身信号之前可以先解码出用户k的信号,在解码自身时不需要考虑其带来的干扰,κbs,uav、κuav,m分别表示基站到无人机之间整体2

硬件损伤水平已经无人机到用户m之间的整体硬件损伤水平,σ表示加性高斯白噪声功率,Pcom表示无人机用于进行通信的功耗,P0、Pi分别表示无人机在悬停状态下的旋翼的轮廓功率和感应功率,Utip表示无人机旋翼的速度,v0表示无人机在悬停时的平均转轴感应向量,d0表示机身拖曳比,ρ表示空气密度,s表示转轴坚固度,A表示旋翼旋转面积,q0表示无人机的初始位置,qF表示无人机最终的位置;

其中约束C1a为无人机在每个时隙内飞行的距离都不超过以最大速度直线飞行的约束,δ为每个时隙的长度,单位为秒,约束C1b为基站发射功率约束,约束C1c为无人机发射功率约束,约束C1d为功率分配系数和的约束,表示总和为1,约束C1e为单个约束都在0到1之间,C1f为每个用户的速率约束限制,C1g为用户m能够解码自身信息的约束,C1h为任意两个用户k,m必有一个能够解码另一个,约束C1i为解码变量的取值约束,约束C1j为当用户k到无人机的距离远于用户m到无人机的距离时,其能被用户m解码的约束,约束C1k表示无人机每个时隙飞行的距离等于该时隙长度乘该时隙速度的约束,约束C1l表示无人机起点位置的约束,约束C1m表示无人机终点位置的约束。

3.根据权利要求2所述的一种无人机协作NOMA通信网络的能效最大化方法,其特征在于,所述步骤2)中,初始化无人机的初始以及终点位置为 和无人机发射功率Puav,并且无人机采用放大转发协议,确定解码顺序变量为φk,m∈{0,1},k, 当φk,m=1时,表示用户k具有更强的信道功率增益,在解码T用户m时,其可被视为噪声,其他情况φk,m=0,确定基站位置qbs=[xbs,ybs]以及其发射功率Pbs、设置用户最小速率门限为Rmin=1bps/Hz、基站功率分配系数定义为α={α1,α2,...,αM},其满足 且每一项均非负,系统中总共有M个用户。定义无人机的飞行周期T=Nδ,T为整个无人机的飞行周期,δ为每个时隙长度,一个周期分为N个时隙。

4.根据权利要求3所述的一种无人机协作NOMA通信网络的能效最大化方法,其特征在于,所述步骤3)中,设置深度Q学习算法中无人机飞行区域范围、定义状态空间st为定义动作空间at为{Pbs,Puav,Vdirection,V},其中Vdirection为飞行方向、定义奖励函数reward为 以无人机充当环境中的智能体。

5.根据权利要求4所述的一种无人机协作NOMA通信网络的能效最大化方法,其特征在于,所述步骤4)中,利用给定的无人机位置及其功率还有飞行速度、基站发射功率,对P1中的目标函数引入近似变量γm,则功率分配子问题可以重写为如下:(P2)

s.t.

C1a‑C1m

C2a:

可以发现近似变量γm对目标函数中信干燥比部分进行了近似,于是便引入了新的约束C2a,其表示引入的近似变量的上界为当前时刻t的原信干噪比;对于问题P2使用拉格朗日对偶法,将约束放至目标函数中处理,问题P2可以重写为如下:(P3)

s.t.

C1a‑C1m

μm表示第m项的拉格朗日乘子,对问题P3的目标函数关于μm求导并令其等于0,可得 并代入P3目标函数每一项后,问题P3可以重写为如下:s.t.

C1a‑C1m

其中有

同样地,使问题P4对γm求导,并令其等于0,可得 并代入P4目标函数每一项后问题P4可以重写为如下:s.t.

C1a‑C1m

其中 对于任意的一项第m项有:

由于P4中目标函数f(α,γ,t,V)中的两项乘积项中的第一项在此处不包含功率分配系数变量α或者近似变量γ,因此不影响对于最优解的求取,在问题P5目标函数中,便可将其去掉,重写为如下:在问题P5目标函数中存在一项分式和部分,对于该分式和部分采用二次变换处理,最终功率分配系数优化问题转化为标准凸优化问题,如下所示:s.t.

C1a‑C1m

其中

此时功率分配优化问题P6已是标准凸优化问题,采用内点法进行重复求解直至前一次与当前求解值相同时则为收敛,对功率分配系数向量α进行更新,否则继续重复求解问题P6直至收敛。

6.根据权利要求5所述的一种无人机协作NOMA通信网络的能效最大化方法,其特征在于,所述步骤5)中,在解码顺序已经功率分配系数固定的情况下,无人机(智能体)此刻状态s(t)为{水平位置坐标、系统能效},此时的动作a(t)为{基站发射功率,无人机发射功率,无人机位置,无人机飞行速度,无人机飞行方向},根据深度Q学习算法,通过下式计算Q值:Q(s(t),a(t))=E[rt+discountmaxQ(s(t+1),a(t+1))s(t),a(t)]其中rt表示当前时刻获得的奖励reward,discount表示折扣因子,当其取0时表示更关注于当前的奖励,E[]表示求期望操作,更新Q值。

7.根据权利要求6所述的一种无人机协作NOMA通信网络的能效最大化方法,其特征在于,所述步骤6)中,对于步骤6)输入的无人机当前状态以及动作当做样本进行学习,通过对当前Q值进行贪婪策略判断,以贪婪概率去选取下一时刻动作,之后更新无人机的位置并进行记录,同时学习后的样本会被存放在经验回放池中。

8.根据权利要求6所述的一种无人机协作NOMA通信网络的能效最大化方法,其特征在于,所述步骤7)中,判断无人机的飞行周期是否结束,若未结束则转至步骤4),若已经结束则先判断无人机飞行周期的平均奖励是否已经收敛,若已经收敛,则将步骤6)中保存的无人机轨迹数据进行绘制,同时输出每个时隙的无人机功率、基站功率、飞行速度和方向,若未收敛则转至步骤2)直至最后周期内的平均奖励收敛为止。