欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2022114744793
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:授权未缴费
专利领域: 电通信技术
更新日期:2025-06-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种物联网场景下用于高效联邦学习的成本优化方法,其特征在于:包括以下步骤:S1:在物联网场景下,建立半异步联邦学习系统时间成本和能耗成本的成本优化模型;

S2:物联网中各个设备上传其资源信息至所属的MEC服务器;

S3:MEC服务器使用时域卷积网络TCN进行资源感知,基于感知结果执行设备选择算法,选择出状态最佳的设备参与本地模型的训练;

S4:MEC服务器将初始全局模型下发至所选择的IoT设备;

S5:根据选择指标,确定是否执行本地训练步骤;

S6:根据S3的设备选择结果,将成本优化问题的约束条件转化为资源分配大小的约束,并采用基于异步优势演员评论家资源分配算法A3C学习最佳的资源分配策略,最终由MEC服务器汇聚梯度,完成其更新任务;

S7:各个设备依据自身的数据集执行本地训练过程;

S8:各个设备异步上传本地更新后的模型;

S9:MEC服务器接收到指定数量的本地模型后,执行全局聚合操作,循环执行步骤S2‑S9,直至全局迭代轮数达到其阈值或全局损失函数收敛。

2.根据权利要求1所述的物联网场景下用于高效联邦学习的成本优化方法,其特征在于:步骤S1中,在最低资源预算的需求下,使得成本函数最小的优化问题表述如下:*

s.t.C1:F(wK)‑F(w)≤δ

C2:Tk≤Tmax

C7:ai∈{0,1}

其中,pk={a1,a2,...,ai,...,aN},表示第k轮进行全局设备选择之后的结果集合;c1和c2分别表示能量成本和时延成本的重要性加权指标,且c1+c2=1;C1表示SAFL训练K轮之后是收敛的;C2表示第k轮中的每个参与SAFL的边缘设备的训练时间不超过时间阈值;C3表示移动设备所分配的计算容量的范围;C4~C5表示为每个移动设备分配的带宽的大小;C6表示每个设备的各个资源类型的剩余率阈值大于该设备参与联邦训练时预期的资源利用率阈值Uk;C7表示是否选择该设备。

3.根据权利要求1所述的物联网场景下用于高效联邦学习的成本优化方法,其特征在于:步骤S3中,采用时域卷积网络TCN对每个移动设备进行资源实时感知,预测每个移动设备未来一段时间的剩余资源状况,所述剩余资源状况包括设备的剩余CPU资源、剩余内存资源和剩余电量资源,取未来一段时间内所预测各设备的剩余资源平均值作为评估标准,计算方式如下:其中, 表示设备vi曾经参加全局模型训练的次数。

4.根据权利要求3所述的物联网场景下用于高效联邦学习的成本优化方法,其特征在于:步骤S3中所述设备选择算法为基于贪婪搜索的设备选择算法,具体为根据各设备模型陈旧度均值的大小、所拥有数据集的大小对成本的影响进行筛选,若满足两项的阈值,再执行资源感知操作,预测设备的剩余资源,从而选择出状态最佳的移动设备参与本地模型的训练。

5.根据权利要求1所述的物联网场景下用于高效联邦学习的成本优化方法,其特征在于:步骤S6中,所述基于异步优势演员评论家资源分配算法A3C的状态空间、动作空间和奖励函数定义如下:状态:在SAFL的第k轮,每个边缘智能体从其各自的环境中收集状态信息,状态信息表示为:sk=(k,wk,Fk,Fk,Tk,Ek,Bk)

其中,k表示全局联邦学习训练轮数的索引,且0<t≤K;wk表示第k轮的全局模型参数;

Fk表示第k轮所聚合的全局损失函数;ΔFk表示当前损失函数与目标损失值之间的差值,即ΔFk=Fk‑δ;Tk表示当前第k轮进行模型训练的完成时间,且 Ek表示当前第k轮进行模型训练所消耗的总能量,且 Bk表示当前第k轮剩余的系统带宽资源;

动作:根据所观察到的各自环境的状态,边缘智能体在每个FL epoch中,对每个所选的边缘设备进行计算资源和带宽资源分配,则动作表示为:其中, 表示带宽资源的分配动作,即 表示CPU频率的

分配动作,即 则给定当前环境状态sk时,智能体会基于一个策略选择动作ak,其中,策略表示为π(ak|sk;θπ);

奖励:一旦智能体对环境执行动作ak后,将从环境中获得奖励反馈,用于评估该动作对环境状态变化趋势的影响,环境立即进入下一个状态sk+1,将奖励函数定义为:其中,

表示k轮之前每轮训练完成时间的均值;

表示k轮之前每轮能量消耗的均值; 表示所分配的带宽资源所占此时剩余带宽资源的比值;K轮之后,训练停止,此时的奖励为:其中 为正整数,即当全局模型训练停止时,如果损失函数达到收敛,则奖励为正,智能体将得到越来越多的回报;否则,奖励为负。

6.根据权利要求1所述的物联网场景下用于高效联邦学习的成本优化方法,其特征在于:步骤S8中,各个设备异步上传其本地更新后的模型,在MEC服务器端,采用半异步聚合的方式,只要接收到指定数量的本地模型,就执行聚合操作,而不是聚合所有的本地模型,以此来加快全局模型的训练速度。