1.一种基于有向无环图DAG区块链的联邦学习方法,其特征在于:该方法包括以下步骤:
S1:外部代理作为任务发起者,边缘服务器承担模型聚合以及区块链维护工作,智能设备执行模型训练任务。外部代理初始化全局模型及创世块,决定训练任务的生灭;
S2:边缘服务器从DAG区块链上选取tips,即未被批准的交易,将交易内模型参数进行聚合形成基础模型,并将其下发至其覆盖范围内的智能设备;
S3:智能设备使用本地数据集进行本地训练,完成一轮本地训练后,向边缘服务器发送状态查询信息以确认是否进行下一轮本地训练;
S4:智能设备完成本地训练后,将已更新模型上传至边缘服务器进行聚合,并将聚合模型作为一个交易上传至DAG区块链;
S5:基于接受到的智能设备信息以及聚合模型更新边缘服务器信誉值,将其一并打包进交易内上传至DAG区块链;
S6:边缘服务器将交易上传至DAG区块链,被边缘服务器拉取的tips视作被新交易批准,tips的累计权重到达一定阈值,则被视作确认;
S7:外部代理以固定周期从DAG区块链上拉取tips并验证其中模型是否已达期望精度,若已满足目标则停止模型训练任务。
2.根据权利要求1所述的一种基于DAG区块链的联邦学习方法,其特征在于:所述S1中,外部代理在控制FL训练任务生灭过程的同时,维护一个智能合约以运行DAG区块链;发起任务时,外部代理会生成一个创世块,内含初始模型参数以及测试数据集,作为任务发起者,外部代理随时监管DAG区块链运行情况,并决定是否终止FL训练任务。
3.根据权利要求2所述的一种基于DAG区块链的联邦学习方法,其特征在于:所述S2中,提供tips选取方法;每笔交易中包含自身权重以及该笔交易上传节点的信誉值,通过计算每个tip在当前可观测的所有tips的权重占比,得到每个tip被选取到的概率;边缘服务器选取多个tips,并将其中模型参数进行聚合得到基础模型,以供其覆盖范围内的智能设备进行本地训练;Tip y被x批准y→x的概率Pxy表示为:其中κ是从1开始取值的参数,CW是tip的累计权重,R是边缘节点的信誉值;在DAG区块链中,每笔交易的累积权重等于其自身权重以及直接和间接验证它的交易数量;当累积权重增加到阈值时,交易被认为在DAG区块链上得到确认。
4.根据权利要求3所述的一种基于DAG区块链的联邦学习方法,其特征在于:所述S3中,提供半异步本地模型更新方法;完成一轮本地训练后,智能设备n向边缘服务器发送带有其当前状态 的查询消息;状态响应消息an将指导智能设备n执行相应的操作;如果an=1,则智能设备n进入下一轮本地训练;当an=0,表示智能设备n的剩余等待时间不足以完成下一次本地训练,否则整体等待时间dwait将会增加,智能设备将更新的本地模型传输至边缘节点进行聚合;最小化整体等待时间,其中,n表示智能设备n,rn表示本地训练轮数计数, 表示本地训练的计算时延, 表示智能设备n与边缘节点之间的通信时延,tn表示发送该查询消息时的时间戳。
5.根据权利要求4所述的一种基于DAG区块链的联邦学习方法,其特征在于:所述S4中,边缘服务器基于智能设备上传的模型更新,采用联邦平均聚合算法得到聚合模型;假设有M个边缘节点,边缘节点m覆盖范围下有Nm个智能设备,边缘节点m第e次聚合模型可计算为:其中,ξ表示全局更新步长,Dn表示智能设备n的本地数据集大小,
6.根据权利要求5所述的一种基于DAG区块链的联邦学习方法,其特征在于:所述S5中,提供一种基于信誉值更新方法;基于历史信誉值、模型聚合阶段获取到的全部智能设备信息,包括本地迭代轮数及设备的数据集大小、聚合模型与基础模型之间的余弦相似度以及聚合模型精度,采用熵权法计算出边缘服务器信誉值R,R为0~100的实数; 表示边缘节点m的第i个指标的标准化值,得 的占比为:其中,i=1表示边缘节点m的历史信誉值,i=2表示边缘节点m下智能设备的本地训练轮数总和,i=3表示边缘节点m下智能设备的本地数据集大小总和,i=4表示边缘节点m的聚合模型与基础模型之间的余弦相似度,i=5表示边缘节点m的聚合模型精度;标准化均采用正向指标,即其数值越高越好,其计算公式为:由于DAG区块链中的边缘节点都在积极训练模型,模型之间的差异用来代表模型的质量;采用余弦相似度表示模型间的差异,表示为:其中, 表示边缘节点m第e次聚合中的基础模型;
由此,指标i的熵权值为:
其中, 指标的熵权值越大,意味着该指标对边缘节点m信誉
值的贡献越大;
得边缘节点m的信誉值为:
信誉值满分为100。
7.根据权利要求6所述的一种基于DAG区块链的联邦学习方法,其特征在于:所述S6中,边缘服务器将聚合模型与信誉值打包为一个交易,上传至DAG区块链;DAG区块链中存在三种交易:①累计权重已达阈值的确认交易;②拥有至少一个批准的未确认交易;③新到达交易,也被称作tips;边缘服务器会将新生成的交易指向获取基础模型时拉取到的tips,此时表明新交易批准这些tips;交易之间通过批准关系建立单向连接,形成DAG结构。
8.根据权利要求7所述的一种基于DAG区块链的联邦学习方法,其特征在于:所述S7中,外部代理在初始化创世块以及模型参数后,每间隔一个固定时间段,依照S2中tips选取方案选取tips并验证其中模型的精度;当模型精度达到期望目标,外部代理向边缘服务器广播终止信号以完成FL训练任务。