1.一种基于融合空天遥感影像的岩溶湿地植被群落分类方法,其特征在于该方法包括如下步骤:
步骤(1):依据无人机航摄影像生成数字正射影像(DOM)和数字表面模型(DSM);
步骤(2):对遥感卫星影像进行预处理;
步骤(3):将步骤(1)与(2)数据进行裁剪和地理配准;
步骤(4):步骤(3)结果与实地采集数据结合随机分为训练样本和验证样本;
步骤(5):对无人机航摄影像与遥感卫星影像进行图像融合;
步骤(6):对融合影像的空间和光谱保真度进行定量和定性评价,得到最佳融合影像;
步骤(7):将步骤(6)中的结果影像、无人机影像和遥感卫星影像分别进行面向对象的多尺度分割;
步骤(8):构建多维数据集确定分类方案;
步骤(9):将步骤(8)中构建的多维数据集进行去高相关性、变量选择和参数调优;
步骤(10):运用70%的训练样本构建优化的面向对象的岩溶湿地植被群落识别模型;
其中XGBoost和LightGBM算法在损失函数上添加了正则化项,计算公式如下:其中 为岩溶湿地植被分类的损失函数,fλ((xi))为新加的岩溶湿地植被群落识别的预测函数,Ω(fλ)为正则化项包括L1、L2,计算公式如下:步骤(11):采用步骤(10)中模型生成岩溶湿地植被群落分类结果图;
步骤(12):运用30%的验证样本验证岩溶湿地植被群落分类结果。
2.如权利要求1所述的基于融合空天遥感影像的岩溶湿地植被群落分类方法,其特征在于步骤(1)中,利用Pix4D Mapper专业级无人机图像处理软件首先对无人机多光谱影像质量检查、影像数据对自动匹配、空三解算、区域网平差;然后生成密集点云数据用来构建不规则三角网,得到研究区地表三维模型,生成DSM和DOM。
3.如权利要求1所述的基于融合空天遥感影像的岩溶湿地植被群落分类方法,其特征在于步骤(6):对融合影像的空间和光谱保真度进行定量和定性评价,评价指标如下所示,得到最佳融合影像;
其中F和R分别代表原始JL101K多光谱数据和融合后的影像,λ(R)和λ(G)是这两幅影像的均值,该值越近1,两个图像之间的相关程度越大;
其中A*B代表原始JL101K多光谱影像和融合后影像的尺寸,该值越接近于零,说明融合结果有较少的错误;
其中H代表高空间分辨率无人机灰度影像的分辨率,L代表低空间分辨率JL101K多光谱影像的分辨率,λ(k)是第k个波段的平均值,该值越接近于零,组合的结果越好;
其中 代表原始低空间分辨率JL101K多光谱影像均值,代表相应融合后的影像平均值, 代表X的方差, 代表Y的方差,σxy代表X与Y的相关系数,该值越接近1,表示融合的结果质量越好。
4.如权利要求1所述的基于融合空天遥感影像的岩溶湿地植被群落分类方法,其特征在于步骤(7)中,多尺度分割是指运用eCognition Developer9.4软件对融合影像、无人机和遥感卫星影像进行多尺度分割算法。在多尺度分割算法中主要有3个重要参数:分割尺度(SP)、形状和紧凑度,其中SP是多尺度分割算法最为核心的参数,对分类精度影响较大,而颜色与形状权重、平滑度与紧凑度权重的和分别为1。
5.如权利要求1所述的基于融合空天遥感影像的岩溶湿地植被群落分类方法,其特征在于步骤(9)中,通过RFE算法确定变量重要性,基于RFE算法的变量选择步骤如下:i.基于包含所有特征变量的训练集训练岩溶湿地植被群落识别模型;
ii.计算模型精度;
iii.对特征变量的重要性进行排名;
iv.对每一个训练子集Si,i=1…S循环执行下述操作:i.)保持Si是最重要的特征变量;
ii.)对数据进行处理;
iii.)用Si作为训练集训练岩溶湿地植被群落识别模型;
iv.)计算模型精度;
v.)重新计算每一个预测因子的重要性排序;
v.结束循环;
vi.计算基于Si的精度曲线;
vii.确定特征变量的最佳数量;
viii.采用基于优化Si的岩溶湿地植被群落识别模型。
6.如权利要求5所述的基于融合空天遥感影像的岩溶湿地植被群落分类方法,其特征在于植被群落识别模型通过RF、XGBoost和LightGBM算法构建,其中XGBoost和LightGBM算法在损失函数上添加了正则化项的计算公式如下:其中 为岩溶湿地植被分类的损失函数,fλ((xi))为新加的岩溶湿地植被群落识别的预测函数,Ω(fλ)为正则化项包括L1、L2,计算公式如下:L1正则化项:
L2正则化项:
参数优化是模型训练过程的一部分,它可以有效地优化模型,从而提高模型的训练精度。其中RF算法主要采用网格搜寻方式对mtry和ntree进行调优,其中mtry的范围为1~15;
ntree的范围为0~2000,步长为100。XGBoost采用Softmax多类分类目标函数,用mlogloss作为其评价指标。首先通过xgb.cv方法对nround进行优化,确定最佳nround,然后采用网格搜寻方式对eta、gamma、max_depth、subsample和colsample_bytree进行优化,通过损失函数种最小的test_logloss来确定最佳组合。LightGBM采用multiclass多类分类目标函数,是将每类归一化为概率的函数分布的区间(0,1)之和为1,用multi_logloss作为模型训练的评价指标。采用网格搜寻方式对num_leaves、learning_rate、max_depth、feature_fraction和bagging_fraction进行优化,通过损失函数种最小的multi_logloss来确定最佳组合。
7.如权利要求1所述的基于融合空天遥感影像的岩溶湿地植被群落分类方法,其特征在于步骤(12):运用30%的验证样本验证岩溶湿地植被群落分类结果是指:运用30%的验证样本对岩溶湿地植被群落分类结果进行精度验证,在95%的置信区间建立混淆矩阵分别计算分类结果的总体精度(OA)、Kappa系数、各类别的用户精度(UA)、生产者精度(PA)和平均精度(AA),通过McNemar’test和配对T检验来评价不同分类算法之间的显著性水平,计算公式如下:
其中N代表岩溶湿地植被群落分类结果总的像元数,M代表被正确分类的像元总和;
其中OA代表岩溶湿地植被群落分类的总体精度,pe代表各类中真实像元数与该类预测分类像元总数之积除以像元总数的平方;
其中a代表整个影像的像元正确分为A类的像元数,A代表混淆矩阵中A类行的总数;
其中b代表整个影像的像元正确分为B类的像元数,B代表混淆矩阵中B类列的总数;
其中UA和PA分别代表岩溶湿地植被群落的生产者精度和用户精度;
其中f1代表在A样本分类错误在B样本中分类正确的个数,f2在A样本分类正确在B样本中分类错误的个数,统计学中在95%置信区间内McNemar’test值>1.96说明两者具有显著性差异;
对两个样本总体采用T检验,两个样本的标准差σA和σB已知且是独立样本时,计算公式如下:
两个样本的标准差σA和σB未知,样本独立且属于大样本时两个样本的标准差σA和σB未知,样本独立且属于小样本时两个样本的标准差σA和σB未知,两个样本具有相关性时其中 分别代表两个样本的平均值; 分别代表两个样本的方差;r为相关样本的相关系数,当ρ<0.05时,说明两个样本具有显著性差异。