1.一种基于K‑means聚类算法的海面风速方法,其特征在于,此方法是基于K‑means聚类算法的,其实施包含雷达图像数据预处理、基于K‑means聚类算法的雷达数据分类、海面风速提取模型确定和海面风速信息提取四个部分,具体反演步骤如下:步骤1,雷达图像数据预处理:应用航海雷达监测系统采集海面雷达图像序列数据,同步应用风力计采集同步海面风向、风速信息,对雷达图像序列应用零强度百分比(ZPP)对降雨噪声较大的图像数据进行识别、剔除;对雨雪干扰较小的图像,应用图像中值滤波抑制噪声和同频信号对海面风向提取的干扰;
步骤2,基于K‑means聚类算法的数据分类:首先,对雷达图像回波强度、海面风向信息、海面风速信息和计算得到的图像信噪比进行数据归一化处理,使数据在同一坐标范围内;
其次,应用K‑means聚类算法对雷达图像回波强度、海面风向信息和图像信噪比数据依据欧式距离对数据进行分类,并应用质心距离误差作为判定依据,得到异类数据;最终,将雷达数据和海面风场信息数据都剔除异类数据相对应的信息数据,得到雷达数据和海面风场信息的聚类数据;
步骤3,海面风速提取模型确定:利用聚类雷达数据和海面风速数据对海面风速进行非线性二次拟合,得到海面风速提取模型,应用SSE验证模型的准确性;
步骤4,海面风速信息提取:选取测试航海雷达图像部分图像,对其进行归一化映射,输入到海面风速提取模型中,得到海面风速信息。
2.根据权利要求1所述的一种基于K‑means聚类算法的海面风速方法,其特征在于:海面风速反演所述步骤2包括以下步骤:步骤2.1,雷达回波强度平均值、海面风向、风速信息及图像信噪比信息进行归一化数据处理;
①对经过预处理的航海雷达图像选取适当部分雷达图像,沿x和y轴进行归一化映射,得到雷达图像均值f'i:
其中,f(x,y)为选取的雷达图像强度值,Nx、Ny为选取图像沿x,y像元数,i是对应的雷达图像数;对f'i进行归一化得到雷达图像归一化值Fi:②获得选取雷达图像信噪比rt,以雷达图像时间序列进行归一化,得到海况信息归一化值Ri:
其中 为二维波数谱经校正后的海浪谱, 为雷达图像海浪信号以外的噪声谱;
③对采集风力计的海面风向信息di、海面风速信息si,按雷达图像序列进行归一化,得到海面风向、风速信息归一化值Di及Si:步骤2.2,基于K‑means聚类算法的雷达数据分类;
①初始化K个初始类簇质心;
对步骤2.1获得的Fi、Ri、Di和Si的所有数据分成两个部分;将用于模型确定中的数据Fi、Ri、Di组成数据集合,作为海面风速影响因素集合;
Ωi={Fi,Ri,Di} (5)初始化类簇质心,随机选取Ωi区域中K个数据点作为初始化质心;
②依据初始化质心划分数据点;
在确定K个海面风速影响因素质心后,在数据集Ωi中找出距离质心最近的数据点,由此形成簇;计算Ωi中所有海面风速影响因素特征的数据点Xi(x1,x2,x3)与选定K个质心Ck(c1,c2,c3)之间的距离,公式如下:各点找到相聚最近的质心后,就归属于该簇,数据集Ωi被划分为K个子区域空间Τk;
③更新聚类质心;
对每个Τk中的 进行均值化,作为下一个更新的质心,计算公式如下:依据更新的质心按照公式(6)重新计算数据点与质心的欧氏距离,同时形成新的簇;
④质心停止更新判断依据;
根据原始质心Ck和更新质心Cj的距离判定质心是否需要进一步更新,判定条件如下:||Ck‑Cj||<<γ (8)当满足上述条件时表示质心趋于收敛,则分类算法终止;若不满足上述条件,则不断重复步骤2.3~2.5,直到满足公式(8),得到聚类质心Cf(f=1,2,…f),及每个质心对应的聚类数据集Τf;
步骤2.3去除异类数据的雷达数据;
根据获得的海面风速影响因素的聚类分布,将质心位置相对其他质心最远的质心被判定为异类质心Cd,其所在区域内的所有数据点也被判定为异类数据集Τd,去除数据集Ωi中的异类数据,同时去除Si中异类数据对应的位置的海面风速Sd,最终得到去除异类雷达数据Ff,Rf,Df,Sf:
Ωf={Ff,Rf,Df}={Ωi‑Τd} Sf={Si‑Sd} (9)步骤3.1,海面风速提取模型确定;先要释放Ff,Sf数据原有特性,得到对应的雷达图像回波强度均值ff,及训练海面风速信息sf:ff=Ff*max(fi'),sf=Sf*max(si) (10)步骤3.2,海面风速提取模型拟合;应用非线性二次函数对数据ff、sf进行拟合,得到海面风速预估模型:
步骤3.3,海面风速模型测试;对模型应用测试数据选取方差函数SSE作为误差检验指标,计算公式如下:
其中,ωi为加权系数,si为实测海面风速,为模型提取出的海面风速;SSE越接近0,则模型越精准,海面风速反演精度越高。
3.根据权利要求2所述的一种基于K‑means聚类算法的海面风速方法,其特征在于,所述步骤2.2中的初始化K个初始类簇质心,Fi、Ri、Di和Si的两个部分为:一部分用于基于K‑means聚类算法海面风速模型的确定,另一部分用于模型的数据测试。
4.根据权利要求2所述的一种基于K‑means聚类算法的海面风速方法,其特征在于,所述步骤2.2的依据初始化质心划分数据点,所有海面风速影响因素特征的数据点Xi(x1,x2,x3)与选定K个质心Ck(c1,c2,c3)之间的距离为欧式距离。
5.根据权利要求2所述的一种基于K‑means聚类算法的海面风速方法,其特征在于,所述质心距离误差判定限制条件γ=0.1,得到聚类数为5。
6.根据权利要求2所述的一种基于K‑means聚类算法的海面风速方法,其特征在于,所述步骤3.2中非线性二次函数对数据ff、sf进行拟合,所述的二次函数系数 为‑9,β为325.9,δ为‑637.6。
7.根据权利要求2所述的一种基于K‑means聚类算法的海面风速方法,其特征在于,所述步骤3.3中海面风速模型测试误差检验指标的计算,所述SSE为对模型输入测试雷达回波强度均值得到的海面风速与测试风速的误差平方和。
8.根据权利要求2所述的一种基于K‑means聚类算法的海面风速方法,其特征在于,所述步骤3.3中海面风速模型测试误差检验指标的计算,所述的方差函数SSE计算公式的系数其中m为数据的个数。