1.一种联邦学习模型训练方法,所述联邦学习模型训练方法应用于第一分布式系统中,其特征在于,所述联邦学习模型训练方法包括:从第二分布式系统获取预设分箱规则、预设加密方法;
根据所述预设加密方法对所述第一分布式系统的第一样本数据的标识信息进行加密,得到第一标识信息;
根据所述预设分箱规则和所述第一标识信息对所述第一样本数据进行分箱,得到多个第一样本箱;
将所述多个第一样本箱加入匹配任务队列;
控制所述第一分布式系统中的多个第一计算单元根据所述第一标识信息从所述匹配任务队列中匹配出多个目标第一样本箱;
将所述多个目标第一样本箱加入训练任务队列;
调用所述多个第一计算单元和所述第二分布式系统中的多个第二计算单元联合处理所述训练任务队列中的训练任务,得到每个目标第一样本箱对应的联邦学习模型。
2.如权利要求1所述的联邦学习模型训练方法,其特征在于,所述根据所述预设分箱规则和所述第一标识信息对所述第一样本数据进行分箱包括:获取所述预设分箱规则中的预设除数;
对每个所述第一标识信息与所述预设除数进行相除并获取余数;
根据所述第一标识信息对应的余数对所述第一样本数据进行分箱,得到多个第一样本箱;
判断每个第一样本箱中的第一样本数量是否大于预设数量阈值;
对第一样本数量大于所述预设数量阈值的第一样本箱进行均匀分割,得到多个子箱。
3.如权利要求1所述的联邦学习模型训练方法,其特征在于,所述控制所述第一分布式系统中的多个第一计算单元根据所述第一标识信息从所述匹配任务队列中匹配出多个目标第一样本箱包括:每次控制一个第一计算单元读取所述匹配任务队列中的一个匹配任务,获取所述匹配任务中的第一样本箱;
控制所述第一计算单元从所述第二分布式系统中获取与所述第一样本箱关联的第二标识信息;
控制所述第一计算单元从所述第一样本箱中匹配出与所述第二标识信息一致的第一标识信息对应的的样本数据,得到多个目标样本数据;
通过所述第一计算单元,删除所述第一样本箱中除所述多个目标样本数据外的样本数据,得到目标第一样本箱。
4.如权利要求3所述的联邦学习模型训练方法,其特征在于,所述控制所述第一计算单元从所述第二分布式系统中获取与所述第一样本箱关联的第二标识信息包括:为所述第一计算单元及所述第二分布式系统中的与所述第一计算单元关联的第二计算单元建立通信通道;
控制所述第一计算单元通过所述通信通道从所述关联的第二计算单元中获取与所述第一样本箱关联的第二样本箱,从所述关联的第二样本箱中获取第二样本数据的第二标识信息。
5.如权利要求1所述的联邦学习模型训练方法,其特征在于,所述将所述多个目标第一样本箱加入训练任务队列包括:获取每个目标第一样本箱中的第二样本数量;
当所述第二样本数量小于预设第一样本数量阈值时,合并第二样本数量小于所述预设第一样本数量阈值的目标第一样本箱,将所述合并后的第一样本箱加入所述训练任务队列;
当所述第二样本数量大于所述预设第二样本数量阈值时,拆分第二样本数量大于所述预设第二样本数量阈值的目标第一样本箱,将所述拆分后的第一样本箱加入所述训练任务队列;
其中,所述预设第二样本数量阈值大于所述预设第一样本数量阈值,所述合并后的目标第一样本箱的第二样本数量小于或等于所述预设第二样本数量阈值,且大于或等于所述预设第一样本数量阈值,所述拆分后的第一样本箱的第二样本数量小于或等于预设第二样本数量阈值,且大于或等于所述预设第一样本数量阈值。
6.如权利要求1所述的联邦学习模型训练方法,其特征在于,所述调用所述多个第一计算单元和所述第二分布式系统中的多个第二计算单元联合处理所述训练任务队列中的训练任务包括:每次控制一个第一计算单元读取所述训练任务队列中的一个训练任务,获取所述训练任务中的目标第一样本箱,为所述第一计算单元及所述第二分布式系统中的与所述第一计算单元关联的第二计算单元建立通信通道;
控制所述第一计算单元通过所述通信通道与所述关联的第二计算单元基于所述目标第一样本箱联合训练联邦学习模型,得到所述目标第一样本箱对应的联邦学习模型。
7.如权利要求6所述的联邦学习模型训练方法,其特征在于,所述第一计算单元与所述关联的第二计算单元通过所述通信通道进行加密通信。
8.一种联邦学习模型训练装置,所述联邦学习模型训练装置运行于第一分布式系统中,其特征在于,所述联邦学习模型训练装置包括:获取模块,用于从第二分布式系统获取预设分箱规则、预设加密方法;
加密模块,用于根据所述预设加密方法对所述第一分布式系统的第一样本数据的标识信息进行加密,得到第一标识信息;
分箱模块,用于根据所述预设分箱规则和所述第一标识信息对所述第一样本数据进行分箱,得到多个第一样本箱;
第一加入模块,用于将所述多个第一样本箱加入匹配任务队列;
匹配模块,用于控制所述第一分布式系统中的多个第一计算单元根据所述第一标识信息从所述匹配任务队列中匹配出多个目标第一样本箱;
第二加入模块,用于将所述多个目标第一样本箱加入训练任务队列;
处理模块,用于调用所述多个第一计算单元和所述第二分布式系统中的多个第二计算单元联合处理所述训练任务队列中的训练任务,得到每个目标第一样本箱对应的联邦学习模型。
9.一种分布式系统,所述分布式系统由多个计算机设备构成,其特征在于,每个计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1-7中任一项所述联邦学习模型训练方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述联邦学习模型训练方法。