欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020100993823
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-08-24
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种面向云掩膜的非均匀类别的样本均衡化方法,实现步骤如下:步骤1:数据预处理与样本获取;

标准假彩色影像上植被呈红色,各种地物与云的可区分性较大,使用标准假彩色方式进行波段合成;

由于原始影像采用不同的量化位数,导致相同的灰度值具有不同的意义,这里通过百分比截断的方式压缩到区间[1,255],保证不同传感器获得的影像具有相似的色彩;

由于影像以景的方式分发,其尺寸远远大于计算机的处理能力,对影像进行切片,输出大小为h*w的影像块,其数目为M;

在此基础上,标记影像块上云所在区域的多边形,制作遥感影像云掩膜样本集G,其中包含N个影像块;

步骤2:样本分组;

将样本G分为K组样本:

G={G1,G2,...,GK}        (1)其中,样本子集G1作为预训练分类器,以获取一个相对稳健的深度学习模型;样本子集{G2,...,Gk-1}组样本测试并迭代选取样本;样本子集GK用于检测精度;

这里根据客户需要,可以保证各个样本子集之间是否存在交集;

步骤3:云掩膜模型训练;

在设置训练超参数后,使用样本子集G1训练深度学习模型,记通过样本子集G1训练得到的模型为C1;

步骤4:分类器掩膜与评价;

使用C1对G2中的样本进行预测,获得掩膜结果,再将其与G2中的标签数据进行比较,从而评价分类结果;

云掩膜结果可以分为正确T、错误F和遗漏M三种类型;其中,正确表示样本标记为云,且分类结果也是云;错误表示样本为非云,而分类器提取为云;遗漏表示样本标记为云,但是分类器未提取;在此基础上,我们选取平均检测率(AR),平均正确率(AP)、整体精度(OA)三个评价指标来评价掩膜精度:其中,#表示像素个数;值得注意的是:由于干净地物构成的背景像素数量远大于云像素数量,使得整体精度难以反映真实的检测效果,因此在计算OA时,忽略该部分像素,从而使得OA和交并比(IoU)相同;

同时,对样本分组GK中的分类结果进行云掩膜及其精度评价,其精度记为OA(GK,C1),步骤5:迭代训练;

对于一块云,将AR和AP均大于0.5的作为正确样本,其他作为错误样本;忽略正确的样2

本,而将错误和遗漏的样本加入,再返回步骤3,训练得到新的分类器C ;然后按照步骤4对样本G3进行评价;

重复上述过程,直到所有样本集用完或分类器达到稳定,这里分类器稳定是指第i次的分类精度OA(GK,Ci)与第i+1次的分类精度OA(GK,Ci+1)的变化小于等于容差e:|OA(GK,Ci)-OA(GK,Ci+1)|≤e       (5)其中,i表示分类器的迭代次数;

将上述步骤获得的稳定的分类器记为CK-1;

步骤6:云掩膜;

K-1

使用分类器模型C 对待处理测试集进行云掩膜,并评价云掩膜精度;

步骤7:掩膜数据后处理;

对掩膜数据进行后处理,剔除小于T的小联通区域的云;填充大块云中小于T的干净联通像素。

2.如权利要求1所述的一种面向云掩膜的非均匀类别的样本均衡化方法,其特征在于:步骤1将近红外波段对应红色,红波段对应绿色,绿波段对应蓝色进行标准假彩色合成,获得标准假彩色影像;直接使用百分比截断将影像从16位降到8位,首先统计影像直方图,提取灰度值到达1%时候的灰度值a和灰度值达到99%时候的灰度值b,然后将[a,b]线性拉伸到[1,255];

将遥感影像裁剪为512*512像素大小的影像块,生成训练所需的数据集,通过上述方式一共获得16000个影像块;

为制作数据集的云掩膜标签,使用ArcMap对影像块上的云进行标注,制作云边界清晰的掩膜标签,然后将其转化为栅格格式。

3.如权利要求1所述的一种面向云掩膜的非均匀类别的样本均衡化方法,其特征在于:步骤2的样本分组具体是:第一组样本作为预训练数据集,用于训练一个相对稳健的深度学习模型;第二组到倒数第二组样本作为精度检验样本并进行精度评价,再加入样本进行增量训练;最后一组样本不参与训练,单独用于检测精度;

根据步骤1进行影像切片后,一共获得16000个影像块,首先将10000个样本用于训练,

6000个样本分为6组用于影像测试,4000个样本用于测试;分为8组,各组样本的数量分别为(6000,1000,1000,1000,1000,1000,1000,4000)。

4.如权利要求1所述的一种面向云掩膜的非均匀类别的样本均衡化方法,其特征在于:步骤3所述的云掩膜模型训练具体做法是:在初始化权重方面,使用COCO数据集上ResNet101的预训练模型来初始化Mask R-CNN网络权重;在超参数设置方面,设置迭代次数=160,batch_size=2,pool_size=7,mask_pool_size=14,初始学习率=0.001,学习率更新系数=0.9;

将步骤2的分组中的第一组数据输入Mask R-CNN模型中,按照所述超参数进行训练,训练得到一个稳定的云掩膜模型C1。