1.一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,包括以下步骤:步骤S1,获取轴承的训练集,所述训练集包含多个带有故障标签的轴承二维时频数据,所述轴承二维时频数据通过小波变换轴承的一维振动信号获得;
步骤S2,构建改进卷积胶囊网络,利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型;
所述改进卷积胶囊网络依次由特征提取网络及胶囊网络构成,所述特征提取网络包含第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层;
将训练集输入至特征提取网络得到二维时频数据的空间特征图,将空间特征图输入至胶囊网络得到预测故障类型;利用Margin Loss损失函数来反向更新特征提取网络及胶囊网络中的权重系数直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型;
步骤S3,将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果。
2.根据权利要求1所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,所述步骤S2中所述第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层的结构如下:所述Inception7层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为7×7;第四尺度第一层为尺寸为5×5的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述Inception5层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为3×3;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第四尺度第一层为尺寸为3×3的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述的Attention层包含通道注意力模块和空间注意力模块,所述通道注意力模块的激活函数为relu和sigmoid函数,所述空间注意力模块的激活函数为sigmoid函数。
3.根据权利要求2所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,所述步骤S2中利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型包括如下步骤:
步骤S21,将训练集输入至Inception7层的输入层,利用Inception7层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception7层的concat连接层进行特征汇总得到第一特征图;将第一特征图输入至Inception5层的输入层,利用Inception5层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception5层的c0oncat连接层进行特征汇总得到第二特征图;将第二特征图输入至Attention层,利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,接着利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图;
步骤S22,将空间特征图输入至胶囊网络的主要帽层形成低层胶囊网络多个神经元,利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新,将高层胶囊网络多个神经元的输出向量输入至分类层得到预测故障类型;
步骤S23,分别计算高层胶囊网络多个神经元的输出向量对应的二范数得到各类故障类型的概率,将各类故障类型的概率输入至分类层得到预测故障类型,利用预测故障类型结合故障标签及各类故障类型的概率计算Margin Loss损失函数,利用Margin Loss损失函数反向更新特征提取网络及胶囊网络中的权重系数;
步骤S24,重复S21至S23,直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型。
4.根据权利要求3所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,步骤S22中的利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新具体步骤如下:第一阶段,记低层胶囊网络的第i个神经元为xi,i=1,2,…,n,n为低层胶囊网络神经元总数,wij为xi对应的权重矩阵,j=1,2,…,m,m为高层胶囊网络神经元总数,xij为预测值,其公式为:
xij=wijxi (1)第二阶段中,对预测值xij进行加权求和得到高层胶囊网络神经元的第一输出向量Sj,其公式为:
公式(2)中,cij为低层胶囊网络神经元的耦合系数;
第三阶段中,对第一输出向量Sj通过squash函数进行处理,获得高层胶囊网络神经元的第二输出向量Zj,其公式为:
第四阶段中,计算低层胶囊网络神经元的耦合系数cij,其公式为:bij=bij+Zixij (5)在每次前向传播时,将bij初始化为0,由公式(4)计算出低层胶囊网络神经元的耦合系数cij的初始化值,再由公式(2)和公式(3)计算出高层胶囊网络神经元的第一输出向量Sj和第二输出向量Zj;由公式(5)更新bij的数值,从而更新cij、Sj和Zj,直至完成3次路由更新算法。
5.根据权利要求3所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,所述步骤S23中所述Margin Loss损失函数公式如下所示:公式(6)中,pj=||Zj||为各类故障的概率;Tj为分类判定函数,假如分类层输出的预测+ +
故障类型与故障标签一致时,则Tj=1,否则Tj=0;m为概率上限值,若pj大于m ,则损失函数‑ ‑
Lj为0;m为概率下限值,若pj小于m,则损失函数Lj为0;λ为比例系数。
6.根据权利要求3所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,步骤S21中利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,具体步骤为:
C×H×W
所述通道注意力模块将第二特征图F∈R 经过池化及感知机操作实现通道特征提C×H×W
取形成通道注意力Mc(F),将通道注意力Mc(F)和第二特征图F∈R 相乘得到通道特征图F',其公式为:
C/r×C C×C/r
公式(7)中,表示逐个元素相乘;W0∈R ,W1∈R ,r为减少率; 表示对F进行平均池化处理, 表示对F进行最大池化处理;σ为sigmoid激活函数,τ为relu激活函数;
步骤S21中利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图,具体步骤为:
所述空间注意力模块将通道特征图F'经过池化和卷积操作实现空间特征提取形成空间注意力Ms(F'),将空间注意力Ms(F')和通道特征图F'相乘得到空间特征图F”,其公式为:公式(8)中, 表示对F'进行平均池化处理, 表示对F'进行最大池化处理;σ为sigmoid激活函数;7×7为卷积核的大小。
7.根据权利要求1‑6中任一项所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,步骤S2还包含利用验证集对训练好的轴承故障诊断模型进行超参数调整得到优化好的轴承故障诊断模型,所述验证集和步骤S1中训练集获取方法一样;
步骤S3,将测试集输入优化好的轴承故障诊断模型得到轴承故障诊断结果。