1.一种面向不平衡钢卷外形缺陷数据的分类方法,其特征在于,包括如下步骤:步骤1:针对钢卷外形缺陷图像数据组成的训练样本集,获取每一类缺陷样本子集在核映射空间上的稀疏化描述;
步骤2:在核映射空间上建立新的多类钢卷外形缺陷分类训练模型,新的多类分类训练模型由每一类钢卷外形缺陷的二分类子模型组成,二分类子模型的正类样本是当前类稀疏化描述数据,负类样本是其它类稀疏化描述数据;
步骤3:建立新的多类钢卷外形缺陷分类预测模型;
步骤4:利用钢卷外形缺陷训练样本集和测试样本集对所有的钢卷外形缺陷二分类子模型和预测模型进行训练,获得模型的最优参数;
步骤5:将未知类别的钢卷外形缺陷样本输入到新的多类分类预测模型中,完成缺陷的自动识别;
所述的步骤1获取每一类缺陷样本子集在核映射空间上的稀疏化描述的过程如下:钢卷外形缺陷训练和测试样本集包括塔形、松卷、错层、吊坏和塌卷缺陷外形样本以及正常钢卷外形样本;
定义第n(n=1,2,…,N)类缺陷样本子集为 其中N是整个样n
本集中的钢卷外形缺陷类别数目, 是子集的第i个样本,m是子集的样本数目,d是样本的维度;
n n
当m≥3时,o定义为子集稀疏的支持向量数据描述,表示为:式中 是 在核映射空间上的样本,φ表示映射函数,拉格朗日算子 通过子集的支持向量数据描述模型的凸二次规划求解获得;
n n
当m=1时,第n类缺陷样本子集在核映射空间上的稀疏化描述o表示为:式中
n n
当m=2时,o表示为:
式中
所述的步骤2在核映射空间上建立新的多类钢卷外形缺陷分类训练模型的过程如下:新的多类分类训练模型由N个二分类子模型组成,第n类的二分类子模型如下:式中 和 是惩罚参数, 是缺陷样本 的优化误差,和 是 的半径和球心, 是子模型构造的一个超球体;
对于二分类子模型,核映射空间上的正类样本 是当前类稀疏化描述数据,核映射空间上的负类样本 是其它类稀疏化描述数据,从而使得 是针对相对平衡的正负类样本进行优化获得的;
对上述的子模型进行推导,获得其对偶子模型如下:式中K是核函数,且满足 是第t类中 元素组成t
的列向量,x (t=n,k,l)是第t类中 对应的 组成的矩阵,且矩阵的列等于样本的维度, 是上述对偶子模型的拉格朗日算子;
通过 确定超球体 的球心和半径,公式如下:式中的 和 定义如下:
2.根据权利要求1所述的一种面向不平衡钢卷外形缺陷数据的分类方法,其特征在于,所述的步骤3建立新的多类钢卷外形缺陷分类预测模型的过程如下:针对一个钢卷外形样本 其预测模型定义如下:式中 是比例参数且满足 调整 到最优的分类超球体。