欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020110993660
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-12-10
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种实例分割模型样本筛选方法,其特征在于,包括:读取原始数据集,所述原始数据集包括未标注集和已标注集;

基于主动学习方式从所述未标注集中挑选出信息量大于剩余样本的多个第一待标注样本,通过人工标注所述多个第一待标注样本的方式得到第一标注集;所有第一待标注样本和所有剩余样本组成所述未标注集;

基于半监督学习方式从所有剩余样本中挑选出置信度高于设定值的第二待标注样本,通过伪标注所述第二待标注样本的方式得到第二标注集;

将所述第一标注集、所述第二标注集以及所述已标注集共同作为当前实例分割模型的训练集,其中,基于主动学习方式从所述未标注集中挑选出信息量大于剩余样本的多个第一待标注样本的步骤包括:计算所述未标注集中各样本的实例检测框得分、实例输出类别得分及实例轮廓掩码得分,以利用所述实例检测框得分、所述实例输出类别得分及所述实例轮廓掩码得分确定各样本的最终得分;

依据所述最终得分与所述信息量之间的负相关或正相关关系从所述未标注集中挑选出所述多个第一待标注样本;

其中,利用所述实例检测框得分、所述实例输出类别得分及所述实例轮廓掩码得分确定各样本的最终得分的过程包括:利用实例检测框得分、实例输出类别得分及实例轮廓掩码得分的均值和标准差计算当前样本中各实例的得分;

利用当前样本中各实例的得分的均值和标准差计算当前样本的最终得分;

其中,实例检测框得分为实例的检测框与真实框的交并比;

实例输出类别得分为实例的分类值;

实例轮廓掩码得分为实例的检测掩码与真实掩码的交并比。

2.根据权利要求1所述的实例分割模型样本筛选方法,其特征在于,基于半监督学习方式从所有剩余样本中挑选出置信度高于设定值的第二待标注样本的步骤包括:获取所述所有剩余样本的实例检测框得分、实例输出类别得分及实例轮廓掩码得分;

当前样本的实例检测框得分大于第一阈值且实例输出类别得分大于第二阈值且实例轮廓掩码得分大于第三阈值时,判断出当前样本的置信度高于设定值,挑选出当前样本作为第二待标注样本。

3.根据权利要求1所述的实例分割模型样本筛选方法,其特征在于,在实例分割模型训练过程中从所述未标注集中挑选第一待标注样本。

4.根据权利要求1所述的实例分割模型样本筛选方法,其特征在于,在实例分割模型训练过程中从所有剩余样本中挑选第二待标注样本。

5.一种实例分割模型样本筛选装置,其用于实现权利要求1‑4中任一项的方法,其特征在于,包括:数据读取模块,读取原始数据集,所述原始数据集包括未标注集和已标注集;

第一筛选模块,用于基于主动学习方式从所述未标注集中挑选出信息量大于剩余样本的多个第一待标注样本,所述多个第一待标注样本被人工标注为第一标注集;所有第一待标注样本和所有剩余样本组成未标注集;

第二筛选模块,用于基于半监督学习方式从所有剩余样本中挑选出置信度高于设定值的第二待标注样本,所述第二待标注样本被伪标注为第二标注集;

数据扩充模块,将所述第一标注集、所述第二标注集以及所述已标注集共同作为当前实例分割模型的训练集。

6.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至4中任一项权利要求所述样本筛选方法的步骤。

7.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至4中任一项权利要求所述样本筛选方法的步骤。