1.一种实时带钢表面缺陷检测方法,其特征在于,包括:步骤S1,选择NEU-DET作为表面缺陷检测数据集,并将数据集按照8:2的比例随机划分出训练集和测试集;
步骤S2,对表面缺陷检测数据集进行预处理;
步骤S3,以YOLOv8n为基础,构建缺陷检测模型SteelGuard-YOLO;
步骤S4,通过训练集对缺陷检测模型SteelGuard-YOLO进行训练,并利用训练后的缺陷检测模型SteelGuard-YOLO对测试集进行检测,输出检测结果;
所述步骤S3中,构建缺陷检测模型SteelGuard-YOLO,包括:在YOLOv8n框架的骨干网络中,引入GSConv代替传统卷积层Conv,且GSConv融合标准卷积与深度可分离卷积结构;
GSConv 在保持与标准卷积相当的特征学习能力的同时,引入分组位移操作与点卷积融合,进而得到 GSResBottleneck结构;
在GSResBottleneck结构的基础上,结合广义深度学习优化策略及 One-Shot 聚合思想,设计ResGSCSP模块;
在YOLOv8n框架的Neck结构中引入多尺度协同注意力机制MSCA,置于SPPF模块之前,并采用轻量化Dysample上采样方法替代原有的最近邻插值方式;
最后,在损失函数设计方面,引入Focal Loss,对易分类样本与难分类样本动态赋予不同权重。
2.根据权利要求1所述的一种实时带钢表面缺陷检测方法,其特征在于,所述步骤S1中,NEU-DET包括裂纹、夹杂物、补丁、凹凸表面、卷曲氧化物和划痕六类典型缺陷,每类均收录300幅分辨率为200 × 200像素的灰度图像。
3.根据权利要求1所述的一种实时带钢表面缺陷检测方法,其特征在于,所述步骤S2中,预处理操作包括但不限于数据增强处理。
4.根据权利要求1所述的一种实时带钢表面缺陷检测方法,其特征在于,所述步骤S3中,GSResBottleneck结构和ResGSCSP模块均引入了残差连接,计算表达式为:;
式中,和分别为残差块的输入与输出,为一系列GSConv、激活函数与归一化操作。
5.根据权利要求1所述的一种实时带钢表面缺陷检测方法,其特征在于,所述步骤S3中,引入多尺度协同注意力机制MSCA,设输入特征图张量为:;
式中,为通道数与空间尺寸,和分别为输入特征图的空间维度,即特征图的高度和宽度,多尺度注意力机制MSCA首先在通道维度上将划分为组子特征,即:;
对每组特征分别执行一维水平与垂直方向的自适应平均池化以获取空间上下文:;
;
式中,为第组在水平第行的平均特征值,为第行第列的位置索引,为第组在垂直第列的平均特征值;
再分别加入可学习的位置编码向量,构建位置信息增强特征:;
;
式中,为注入水平位置编码后的池化特征,为原始水平池化结果,为可学习的水平位置编码向量,为注入垂直位置编码后的池化特征,为原始垂直池化结果,为可学习的垂直位置编码向量;
上述两个方向的特征拼接为二维表征:;
式中,为特征拼接操作;
依次施加深度可分离卷积以捕捉长短距离联合空间依赖:;
;
式中,为经DWConv后的特征响应,为经PWConv后的特征响应,为对做深度可分离卷积,为对做逐点卷积;
再通过 Sigmoid 激活生成空间注意力权重:;
;
式中,为水平空间注意力权重,为对前行特征做Sigmoid激活后的结果,为垂直空间注意力权重,为对后行特征做Sigmoid并转置后的结果,为转置操作;
得到空间加权输出:
;
对进行通道压缩以提取全局通道语义:;
式中,为通道压缩操作;
输入两层逐点卷积网络进行门控变换:;
式中,为通道门控系数向量;
其中权重维度为:
;
;
激活函数为:
;
;
最终通道加权特征表示为:
;
对应用卷积整合空间-通道特征,并与原始特征相加,实现高效融合:;
为增强信息流的有效传递,进一步通过残差注意力机制对融合后的特征进行自适应加权:;
式中,为自适应加权函数,能够动态地根据输入特征的重要性分配不同的权重;
最终输出特征为:
。
6.根据权利要求1所述的一种实时带钢表面缺陷检测方法,其特征在于,所述步骤S3中,采用轻量化Dysample上采样方法替代原有的最近邻插值方式,包括:采用grid_sample函数,以采样集提供的坐标对输入特征图进行重采样,该过程基于双线性插值方法,实现特征映射,生成新特征图,具体定义如下:;
设上采样比例因子为,通过一层线性变换将通道数由映射至,生成偏移量张量:;
随后,借助Pixel Shuffle操作将偏移量张量重排为尺寸为的坐标偏移场,并与原始规则采样网格相加,得到动态采样集:;
;
最后,利用基于的双线性插值函数对进行重采样,直接生成高分辨率特征图。
7.根据权利要求1所述的一种实时带钢表面缺陷检测方法,其特征在于,所述步骤S3中,在损失函数设计方面,引入Focal Loss,对易分类样本与难分类样本动态赋予不同权重,包括:设标准的多类别交叉熵损失函数定义为:;
式中,为模型输出的第类的预测概率,为实际标签;
在损失函数基础上,通过引入调制系数,使网络在训练过程中更加侧重于预测置信度低、难分样本的梯度反馈,其形式表示为:;
式中,为可调超参数;
当某样本被错误分类时,值较小,此时调制系数接近 1,与标准交叉熵损失保持一致;
对于易分样本,值较大,调制系数趋近于 0,从而显著降低其对总损失的贡献。