1.一种数据标注方法,其特征在于,包括:
将待标注样本数据集输入到教师模型中进行标注,得到第一标注样本集,以及所述第一标注样本集中每一标注样本的可信度;
在一个训练周期内,确定可信度阈值,从所述第一标注样本集中确定出第二标注样本集,使用所述第二标注样本集对学生模型进行训练,得到训练后的学生模型,并获取所述训练后的学生模型的目标评价指标;其中,所述第二标注样本集中每一标注样本的可信度均大于或等于所述可信度阈值;
根据N个训练周期内获取的N个所述目标评价指标,从在所述N个训练周期内所确定的N个第二标注样本集中,确定出目标标注样本集,N为大于1的整数。
2.根据权利要求1所述的方法,其特征在于,在第i个训练周期中进行训练的学生模型,为在第i-1个训练周期中训练得到的学生模型;i为大于1且小于或等于N的整数。
3.根据权利要求1或2所述的方法,其特征在于,在第i个训练周期中所确定的可信度阈值,大于在第i-1个训练周期中所确定的可信度阈值,且小于或等于预设的可信度阈值上限值;i为大于1且小于或等于N的整数。
4.根据权利要求1所述的方法,其特征在于,所述使用所述第二标注样本集对学生模型进行训练,得到训练后的学生模型,并获取所述训练后的学生模型的目标评价指标,包括:针对所述第二标注样本集划分为训练集与第一验证集;
使用所述训练集对所述学生模型进行训练,得到训练后的学生模型;
基于所述第一验证集,获取所述训练后的学生模型的目标评价指标。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一验证集,获取所述训练后的学生模型的目标评价指标,包括:获取预设的第二验证集;
基于所述第一验证集与所述第二验证集,获取所述训练后的学生模型的目标评价指标。
6.据权利要求1所述的方法,其特征在于,所述根据N个训练周期内获取的N个所述目标评价指标,从在所述N个训练周期内所确定的N个第二标注样本集中,确定出目标标注样本集,包括:将第n个训练周期内所确定的第二标注样本集,确定为目标标注样本集;
其中,在所述第n个训练周期获取的目标评价指标为N个所述目标评价指标中的最优目标评价指标,且所述第n个训练周期获取的目标评价指标优于初始学生模型的目标评价指标,所述初始学生模型为第一个训练周期开始之前的学生模型,n为小于或等于N的整数。
7.根据权利要求1所述的方法,其特征在于,所述根据N个训练周期内获取的N个所述目标评价指标,从在所述N个训练周期内所确定的N个第二标注样本集中,确定出目标标注样本集之后,所述方法还包括:获取目标可信度阈值,所述目标可信度阈值为与所述目标标注样本集对应的训练周期中所确定的可信度阈值,所述目标可信度阈值用于指导标注样本集的选取。
8.一种数据标注装置,其特征在于,所述装置包括:
标记模块,用于将待标注样本数据集输入到教师模型中进行标注,得到第一标注样本集,以及所述第一标注样本集中每一标注样本的可信度;
训练模块,用于在一个训练周期内,确定可信度阈值,从所述第一标注样本集中确定出第二标注样本集,使用所述第二标注样本集对学生模型进行训练,得到训练后的学生模型,并获取所述训练后的学生模型的目标评价指标;其中,所述第二标注样本集中每一标注样本的可信度均大于或等于所述可信度阈值;
确定模块,用于根据N个训练周期内获取的N个所述目标评价指标,从在所述N个训练周期内所确定的N个第二标注样本集中,确定出目标标注样本集,N为大于1的整数。
9.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的数据标注方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的数据标注方法。