1.一种具备鲁棒性的半监督图像聚类方法,其特征在于,包括以下步骤:步骤一:生成具备鲁棒性的半监督聚类模型,如式(8)所示:其中,X为输入数据矩阵,F为对X进行非负矩阵分解得到的结果矩阵,G为聚类指示矩阵, L为图拉普拉斯矩阵,λmin_L和λmax_L分别是图拉普拉斯矩阵L的最小和最大特征值;Z'为成对约束矩阵, 矩阵Z的计算式为Z=H‑Q,H=diag(Q﹒1n×1),矩阵Q表示标记样本间的成对约束关系,diag()是对角矩阵生成函数,λmin_Z和λmax_Z分别是成对约束矩阵Z的最小和最大特征值,n表示样本数量;T表示矩阵的转置,λ为正则化参数,参数k为正数,参数τ的范围在[0,1];式(8)即具备鲁棒性的半监督聚类模型可分为两部分,第一部分是基于l2,1正则化的非负矩阵分解目标函数,把原本目标函数中的Frobenius正则化替换为l2,1正则化来减少噪声和离群值的影响;第二部分是流形与成对约束联合正则化框架,通过参数τ的调节来合理安排流形正则化和成对约束正则化各自对整体的影响;
步骤二:利用通过步骤一的算法框架,并把数据预处理过程中处理的图像数据导入到算法模型中,得到图像的聚类结果。
2.根据权利要求1所述的一种具备鲁棒性的半监督图像聚类方法,其特征在于,所述的步骤一的算法的优化步骤包括:(A).利用增广拉格朗日乘子法(Augmented Lagrangian Multiplier,ALM)来处理式T(8),这里有两个变量F和G,我们首先引入两个辅助变量E=X‑FG 和H=G,然后重写目标函数:T
s.t.H≥0,GG=I,
其中S=(1‑τ)L'+τZ',这里μ,∧和∑都是ALM框架的参数;μ是决定不可行性惩罚的规范化系数;∧和∑都是用来惩罚目标变量和辅助变量之间的差距;μ是标量,∧和∑是两个n×k维的矩阵;
(B).优化
1)更新E
固定F,H和G,目标函数变为:
2)更新F
固定E,H和G,目标函数变为:
这是一个经典的回归问题,我们定义:T
F的解变为F=JG,由于GG=I;
这就显示出给G加上正交约束的必要性,保证了解的唯一性,减少了计算量;
3)更新H
固定F,E和G,目标函数变为:
展开上式并舍弃与H无关的项得:
令
可得H的解为Hij=max(Mij,0); (29)
4)更新G
固定F,E和H,目标函数变为:
和上一部分优化H的过程相似,令
可将式(30)写为如下形式:
在此引入定理2去解决上式;
5)更新μ,∑和∧
更新完F,E,H和G四个变量之后,还需要去更新ALM框架的参数;
T
^=^+μ(X‑FG‑E); (38)∑=∑+μ(G‑H); (39)μ=ρμ; (40)。
3.根据权利要求1所述的一种具备鲁棒性的半监督图像聚类方法,其特征在于,所述的步骤二中的图像数据是通过原始图像的数据预处理的,包含如下步骤:步骤一:将所有原始图像进行灰度化处理,并进行尺寸统一,并把每张图像的所有像素点作为一个样本的特征,这样得到一个初步的图像数据;
步骤二:对步骤一中的得到数据进行数据归一化,得到相应的图像数据。