知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

模型并行训练方法、装置、设备、存储介质和程序产品

面议

专利号： 2020114595893

申请人：北京百度网讯科技有限公司

专利类型：发明专利

专利状态：授权未缴费

专利领域：计算；推算；计数

更新日期：2024-05-12

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种模型并行训练方法，由参与并行训练的每一图形处理器GPU执行，所述方法包括：预先为参与并行训练的每个GPU分配局部分类标签；

获取该GPU的局部训练样本数据；其中，该GPU的局部训练样本数据与预先为该GPU分配的局部分类标签关联；

根据获取的局部训练样本数据确定特征提取网络中第一参数的本地局部梯度数据和分类器中第二参数的本地局部梯度数据；

根据第一参数的本地局部梯度数据和其他GPU中第一参数的其他局部梯度数据对特征提取网络进行更新；所述其他局部梯度数据是通过不同GPU中特征提取网络之间相互数据整合通信得到的；

根据第二参数的本地局部梯度数据对分类器进行更新。

2.根据权利要求1所述的方法，所述方法还包括：

根据全量训练样本数据的全量分类标签数量和参与并行训练的GPU数量，为每一GPU分配局部分类标签。

3.根据权利要求1所述的方法，其中，该GPU使用与其他GPU不同的专属数据加载器；所述获取该GPU的局部训练样本数据，包括：通过该GPU的专属数据加载器获取该GPU的局部训练样本数据。

4.根据权利要求1所述的方法，其中，所述根据获取的局部训练样本数据确定特征提取网络中第一参数的本地局部梯度数据和分类器中第二参数的本地局部梯度数据，包括：通过特征提取网络对获取的局部训练样本数据进行特征提取得到本地局部特征，通过分类器对所述本地局部特征进行分类得到分类预测结果；

根据所述分类预测结果，确定特征提取网络中第一参数的本地局部梯度数据和分类器中第二参数的本地局部梯度数据。

5.根据权利要求1所述的方法，其中，所述根据第一参数的本地局部梯度数据和其他GPU中第一参数的其他局部梯度数据对特征提取网络进行更新，包括：从其他GPU获取其他GPU中第一参数的其他局部梯度数据；

根据第一参数的本地局部梯度数据和所述其他局部梯度数据，确定第一参数的全局梯度数据；

根据所述第一参数的全局梯度数据，对特征提取网络进行更新。

6.根据权利要求1-5中任一项所述的方法，其中，参与并行训练的各GPU的特征提取网络中第一参数的初始值相同。

7.根据权利要求1-5中任一项所述的方法，其中，每一GPU中分类器的输入数据维度与预先为该GPU分配的局部分类标签数量相同。

8.根据权利要求1-5中任一项所述的方法，还包括：在训练完成后，从参与并行训练的每一GPU中选择任意一个GPU的特征提取网络作为特征提取网络任务的训练结果。

9.一种模型并行训练装置，配置于参与并行训练的每一图形处理器GPU中，所述装置包括：分类标签分配模块，用于预先为参与并行训练的每个GPU分配局部分类标签；

训练样本获取模块，用于获取该GPU的局部训练样本数据；其中，该GPU的局部训练样本数据与预先为该GPU分配的局部分类标签关联；

局部梯度确定模块，用于根据获取的局部训练样本数据确定特征提取网络中第一参数的本地局部梯度数据和分类器中第二参数的本地局部梯度数据；

特征提取网络更新模块，用于根据第一参数的本地局部梯度数据和其他GPU中第一参数的其他局部梯度数据对特征提取网络进行更新；所述其他局部梯度数据是通过不同GPU中特征提取网络之间相互数据整合通信得到的；

分类器更新模块，用于根据第二参数的本地局部梯度数据对分类器进行更新。

10.根据权利要求9所述的装置，

分类标签分配模块，具体用于根据全量训练样本数据的全量分类标签数量和参与并行训练的GPU数量，为每一GPU分配局部分类标签。

11.根据权利要求9所述的装置，其中，该GPU使用与其他GPU不同的专属数据加载器；所述训练样本获取模块具体用于：通过该GPU的专属数据加载器获取该GPU的局部训练样本数据。

12.根据权利要求9所述的装置，其中，所述局部梯度确定模块包括：样本处理单元，用于通过特征提取网络对获取的局部训练样本数据进行特征提取得到本地局部特征，通过分类器对所述本地局部特征进行分类得到分类预测结果；

局部梯度确定单元，用于根据所述分类预测结果，确定特征提取网络中第一参数的本地局部梯度数据和分类器中第二参数的本地局部梯度数据。

13.根据权利要求9所述的装置，其中，所述特征提取网络更新模块包括：其他局部梯度获取单元，用于从其他GPU获取其他GPU中第一参数的其他局部梯度数据；

全局梯度确定单元，用于根据第一参数的本地局部梯度数据和所述其他局部梯度数据，确定第一参数的全局梯度数据；

特征提取网络更新单元，用于根据所述第一参数的全局梯度数据，对特征提取网络进行更新。

14.根据权利要求9-13中任一项所述的装置，其中，参与并行训练的各GPU的特征提取网络中第一参数的初始值相同。

15.根据权利要求9-13中任一项所述的装置，其中，每一GPU中分类器的输入数据维度与预先为该GPU分配的局部分类标签数量相同。

16.根据权利要求9-13中任一项所述的装置，所述装置还包括：训练结果确定模块，用于在训练完成后，从参与并行训练的每一GPU中选择任意一个GPU的特征提取网络作为特征提取网络任务的训练结果。

17.一种电子设备，其中，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。

推荐专利

内容推荐方法和装置、训练方法、计算设备和存储介质

发明专利

面议

一种声学模型训练方法和装置、计算机设备、存储介质

发明专利

￥28000

模型训练方法、装置、设备、存储介质和程序产品

发明专利

￥26000

商品训练图片的获取方法、装置、计算机设备和存储介质

发明专利

￥28000

我要求购

我不想找了，帮我找吧

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

知嘟嘟

友情链接

关于我们

联系我们