1.一种基于集成学习的黑色素瘤皮肤病图像分类方法,其特征在于,所述方法包括以下步骤:步骤1,使用基于随机掩盖大小固定的区域的数据增强方式来扩充训练样本,过程如下:
1.1依次从训练集中无放回取图片img,并获取它们的宽img_w和高img_h;
1.2初始化掩盖区域的宽w=s,高h=s;
1.3随机从(0,img_w-s)中初始化掩盖区域的左上角横轴坐标x0,随机从(0,img_h-s)中初始化掩盖区域的左上角纵轴坐标y0,掩盖区域的右下角坐标为(x0+s,y0+s);
1.4将区域(x0,y0,x0+s,y0+s)的像素值置为0;
1.5保存增强后的图片;
步骤2,建立多个卷积神经网络模型
使用的训练集包含黑色素瘤皮肤病图像和非黑色素瘤皮肤病图像;
2个训练集的组成分别如下:
训练集1:原始训练集和对原始训练集进行随机掩盖的到的增强样本,其中增强过程中分别设定s=150,s=300;
训练集2:原始训练集和对原始训练集进行随机掩盖的到的增强样本,其中增强过程中分别设定s=150,s=200,s=250,s=300;
使用卷积残差50层网络:对输入图片使用64个卷积核,卷积核大小为7*7,从而得到第二个条形方块,然后再进行池化,池化区域大小为3*3,图2中后面的Res1-3代表第1-3个残差块,Input Xn-1代表n-1层的输出,同时也是残差块的输入,残差块中1*1conv代表卷积核大小为1*1,Batch Norm代表该层为归一化层,就是以Batch为单位,将里面的数据统一按照一定的方式缩放到一定的范围内,ReLU代表该层为激活函数层,该层使用的激活函数为ReLU,其函数表达式如下:然后Fl(Xn-1)代表经过残差块的运算之后输入到输出之间的映射,侧边的shortcut连接迫使残差块学习到的映射更贴近于输入,Output Xn代表残差块的输出;
目标函数:模型训练过程中采用交叉熵损失函数作为目标函数,其形式如下:P代表训练过程中模型输出的概率值,y代表图片的真实标签,黑色素瘤的标签为1,非黑色素瘤的标签为0;
步骤3,卷积神经网络模型的集成
假定由训练集1训练得到的模型为分类模型1,训练集2训练得到的模型为分类模型2,对分类模型1和分类模型2分别使用测试集来测试其效果,然后每个模型会各自给出测试样本属于黑色素瘤的概率值p1,p2,集成的时候对于测试样本属于黑色素瘤的概率p=(p1+p2)/2。