欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 202010136917X
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-12-10
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种训练样本扩充方法,其特征在于,所述方法包括:

当需要训练辅助诊断模型时,获取真实样本数据集,其中,所述真实样本数据集由多种疾病类型的样本组成,每种所述疾病类型的样本包括至少一个疾病症状;

当所述多种疾病类型的样本中存在目标疾病类型的样本的数量小于预设数量阈值时,将所述目标疾病类型的样本确定为目标样本;

通过预先训练好的转换网络,将所述目标样本对应的疾病名称进行向量转换,获得名称向量;

根据预先训练好的第一疾病分类模型,基于所述第一疾病分类模型的精度以及判别网络的梯度变化,对生成网络进行训练,获得训练好的生成模型;

将所述名称向量输入至所述训练好的生成模型,获得生成样本数据集,所述生成样本数据集包括的多个生成样本的疾病类型与所述目标疾病类型一致;

所述第一疾病分类模型是使用第二训练样本数据集训练的,使用所述第一疾病分类模型,根据所述第一疾病分类模型的精度,判断所述生成样本数据集中的多个生成样本是否可用于模型训练,包括:根据测试数据集,确定所述第一疾病分类模型的第一精度;将所述多个生成样本以及所述第二训练样本数据集确定为第三训练样本数据集;对所述第三训练样本数据集进行训练,获得第二疾病分类模型;根据所述测试数据集,确定所述第二疾病分类模型的第二精度;判断所述第二精度是否大于所述第一精度;若所述第二精度大于所述第一精度,确定所述多个生成样本可用于模型训练;或若所述第二精度小于或等于所述第一精度,确定所述多个生成样本不可用于模型训练;

若所述生成样本数据集中的多个生成样本可用于模型训练,将所述真实样本数据集和所述生成样本数据集确定为所述辅助诊断模型的第一训练样本数据集。

2.根据权利要求1所述的方法,其特征在于,所述通过预先训练好的转换网络,将所述目标样本对应的疾病名称进行向量转换,获得名称向量之后,所述方法还包括:将所述名称向量的维度确定为所述生成网络的输入数组的维度;

将所述名称向量对应的疾病症状关系库中所有症状的数量确定为所述生成网络的输出数组的维度大小,并将预设值确定为所述生成网络的输出数组的元素的取值;

所述根据预先训练好的第一疾病分类模型,基于所述第一疾病分类模型的精度以及判别网络的梯度变化,对生成网络进行训练,获得训练好的生成模型包括:根据预先训练好的第一疾病分类模型,基于所述第一疾病分类模型的精度以及判别网络的梯度变化,按照所述生成网络的输入数组的维度、所述输出数组的维度大小以及所述输出数组的元素的取值,对生成网络进行训练,获得训练好的生成模型。

3.根据权利要求1所述的方法,其特征在于,所述根据预先训练好的第一疾病分类模型,基于所述第一疾病分类模型的精度以及判别网络的梯度变化,对生成网络进行训练,获得训练好的生成模型包括:使用生成网络生成疾病类型与所述目标疾病类型一致的多个假样本;

将所述多个假样本与所述第二训练样本数据集确定为第四训练样本数据集;

对所述第四训练样本数据集进行训练,获得第三疾病分类模型;

确定所述第三疾病分类模型的第三精度;

根据所述第三精度以及判别网络的梯度变化,对所述生成网络的参数进行更新,获得训练好的生成模型。

4.根据权利要求3所述的方法,其特征在于,所述根据所述第三精度以及判别网络的梯度变化,对所述生成网络的参数进行更新,获得训练好的生成模型包括:根据所述第三精度以及所述第一精度,确定精度变化率;

根据所述精度变化率以及所述判别网络的第一梯度变化,获得第二梯度变化;

通过反向传播算法,根据所述第二梯度变化,更新所述生成网络的参数,获得训练好的生成模型。

5.根据权利要求1至4中任一项所述的方法,其特征在于,所述判别网络的损失函数为交叉熵损失函数。

6.根据权利要求1至4中任一项所述的方法,其特征在于,所述转换网络是将完整的实体名词作为输入去训练的,所述判别网络的输出值为预设数值范围的浮点数,所述输出值用于衡量所述判别网络的输入为假数据的概率。

7.一种训练样本扩充装置,其特征在于,所述训练样本扩充装置包括:

获取模块,用于当需要训练辅助诊断模型时,获取真实样本数据集,其中,所述真实样本数据集由多种疾病类型的样本组成,每种所述疾病类型的样本包括至少一个疾病症状;

确定模块,用于当所述多种疾病类型的样本中存在目标疾病类型的样本的数量小于预设数量阈值时,将所述目标疾病类型的样本确定为目标样本;

转换模块,用于通过预先训练好的转换网络,将所述目标样本对应的疾病名称进行向量转换,获得名称向量;

训练模块,用于根据预先训练好的第一疾病分类模型,基于所述第一疾病分类模型的精度以及判别网络的梯度变化,对生成网络进行训练,获得训练好的生成模型;

输入模块,用于将所述名称向量输入至所述训练好的生成模型,获得生成样本数据集,所述生成样本数据集包括的多个生成样本的疾病类型与所述目标疾病类型一致;

判断模块,用于所述第一疾病分类模型是使用第二训练样本数据集训练的,使用所述第一疾病分类模型,根据所述第一疾病分类模型的精度,判断所述生成样本数据集中的多个生成样本是否可用于模型训练,包括:根据测试数据集,确定所述第一疾病分类模型的第一精度;将所述多个生成样本以及所述第二训练样本数据集确定为第三训练样本数据集;对所述第三训练样本数据集进行训练,获得第二疾病分类模型;根据所述测试数据集,确定所述第二疾病分类模型的第二精度;判断所述第二精度是否大于所述第一精度;若所述第二精度大于所述第一精度,确定所述多个生成样本可用于模型训练;或若所述第二精度小于或等于所述第一精度,确定所述多个生成样本不可用于模型训练;

所述确定模块,还用于若所述生成样本数据集中的多个生成样本可用于模型训练,将所述真实样本数据集和所述生成样本数据集确定为所述辅助诊断模型的第一训练样本数据集。

8.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1至6中任意一项所述的训练样本扩充方法。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至6中任意一项所述的训练样本扩充方法。