1.基于循环一致性对抗网络的碑帖二值化背景噪声模拟方法,其特征在于,包括如下步骤:步骤1,建立取样样本;
步骤2,根据步骤1中的取样样本,进行预处理,得到最终训练数据;
步骤3,将步骤2中得到的最终训练数据进行训练,依次更新辨别器权重和生成器权重;
步骤4,将待处理的碑帖数据样本带入经步骤3更新的辨别器和生成器中进行加噪,得到模拟噪声后的配对碑帖数据集。
2.如权利要求1所述的基于循环一致性对抗网络的碑帖二值化背景噪声模拟方法,其特征在于,所述步骤1的具体过程为:收集多张碑帖图像,将其人工分为干净图像和噪声图像两类,最终分别得到m张不配对的带噪声图片和干净图像,即为取样样本。
3.如权利要求1所述的基于循环一致性对抗网络的碑帖二值化背景噪声模拟方法,其特征在于,所述步骤2的具体过程为:步骤2.1,对步骤1取样样本中的带噪图片和干净图片,进行二值化操作,若二值化后的图片背景色为黑色则进行反色操作,即将二值化后的碑帖背景由黑色转为白色,字体由白色转为黑色,便于噪声模拟;
步骤2.2,对步骤2.1处理后的2m张图片,将每张图片随机切割成大小为c×r的图片,即得到2m张大小为c×r的图片;汇总后得到训练数据集。
4.如权利要求1所述的基于循环一致性对抗网络的碑帖二值化背景噪声模拟方法,其特征在于,所述步骤3的具体过程为:步骤3.1,选取步骤2中任意一个干净图像X,输入生成器网络G,干净的图像X经过生成器网络G计算,输出一张与输入图像一样大小的带有模拟噪声的图像fake_img0=G(X),将得到的带有模拟噪声的图像fake_img0输入另一个生成器网络F得到大小与干净图像X相同的对模拟噪声去除后的图像fcleaned_img=F(G(X));
步骤3.2,选取步骤2中任意一个带噪声图像Y,输入生成器网络F,带噪声的图像Y经过生成器网络F计算,输出一张与输入图像一样大小的去除噪声后的图像fake_img1=F(Y),将得到的去除噪声后的图像fake_img1输入步骤3.1中的生成器网络G得到大小与输入图像Y相同的加上模拟噪声后的图像fnoised_img=G(F(Y));
步骤3.3,将步骤3.1得到的图像fake_img0=G(X)和步骤3.2选取的噪声图像Y分别输入生成网络G对应的辨别器网络Dy,输出概率值Dy(G(X))和Dy(Y),建立生成器G与辨别器Dy的对抗损失函数;
步骤3.4,将步骤3.2得到的图像fake_img1=F(Y)和步骤3.1选取的干净图像X分别输入生成器网络F对应的辨别器网络Dx,输出概率是Dx(F(Y))和Dx(X),建立生成器F与辨别器Dx的对抗损失函数;
步骤3.5,计算出步骤3.4中生成器G和F以及辨别器Dx和Dy的损失,使用Adam梯度下降方法来依次更新辨别器网络权重Adam(ω,DyLossω,α),Adam(ω,DxLossω,α)和生成器网络的权重Adam(θ,GLossθ,α),Adam(θ,FLossθ,α),其中α表示梯度下降的学习率且α=0.0002,
当Dy(G(X))≈Dy(Y),则fake_img0≈Y,得到经过生成器网络G后的图像fake_img0即为加噪后的图像,训练完成。
5.如权利要求4所述的基于循环一致性对抗网络的碑帖二值化背景噪声模拟方法,其特征在于,设定步骤3.1-3.2生成器G和F之间的循环一致性损失函数为公式(1):其中 表示X服从真实干净数据概率分布的期望, 表示Y服从真实带噪
数据概率分布的期望,||.||2表示欧式距离,F(G(X))表示干净图像经过生成器G加噪然后经过生成器F进行去噪后的结果,G(F(Y))表示带噪图像经过生成器F去噪然后经过生成器G进行加噪后的结果。
6.如权利要求4所述的基于循环一致性对抗网络的碑帖二值化背景噪声模拟方法,其特征在于,所述步骤3.3的生成器G与辨别器Dy的对抗损失函数为公式(2):公式(2)可分解为:
GLossθ=log(1-Dy(G(X)))+λLcyc(G) (3)DyLossω=-logDy(Y)-log(1-Dy(G(X))) (4)其中Dy(G(X))表示生成图像G(X)输入辨别器网络Dy后的输出值,表示该图像为真的概率;Dy(Y)表示带噪图像Y输入辨别网络Dy后的输出值,表示该图像为真的概率;Lcyc(G)表示生成器G的循环一致性损失,λ为常数且λ=100,GLossθ表示生成器G的损失函数,DyLossω表示辨别器Dy的损失函数,其中θ和ω分别表示为生成器网络G的权重和辨别器网络Dy的权重。
7.如权利要求4所述的基于循环一致性对抗网络的碑帖二值化背景噪声模拟方法,其特征在于,所述步骤3.4生成器F与辨别器Dx的对抗损失函数为公式(5):公式(5)可分解为:
FLossθ=log(1-Dx(F(Y)))+λLcyc(F) (3)DxLossω=-logDx(X)-log(1-Dx(F(Y))) (4)其中Dx(F(Y))表示生成图像F(Y)输入辨别器网络Dx后的输出值,表示该图像为真的概率;Dx(X)表示干净图像X输入辨别网络Dx后的输出值,表示该图像为真的概率;Lcyc(F)表示生成器F的循环一致性损失,λ为常数且λ=100,FLossθ表示生成器F的损失函数,DxLossω表示辨别器Dx的损失函数,其中θ和ω分别表示为生成器网络F的权重和辨别器网络Dx的权重。
8.如权利要求1所述的基于循环一致性对抗网络的碑帖二值化背景噪声模拟方法,其特征在于,所述步骤4的具体过程为:步骤4.1,将需要加噪的干净碑帖图像二值化,得到二值化碑帖图像img_bw;人为判断二值化碑帖图像img_bw背景是否为白色,如果不是白色则进行操作:img_bw=1-img_bw;
步骤4.3,将步骤1处理后图像的输入经步骤3更新的生成器G中,得到G(img_bw),输出结果G(img_bw)即加上模拟噪声后的结果。